Дополню вопрос: почему также свободно продаются готовые сайты на нулёных движках? ;)
делай цикл скоко хочешь страниц
$html = file_get_contents(" http://yandex.ru/yandsearch?p= [номер страницы] &text= [запрос] "); preg_match_all("!<span class=\"green_url\">(.*?)\ !is",$html,$links); $links=$links[1];
из links на каждом шаге выгружай массив урлов. примерно както так. вот весь ваш парсер, который нужно разработать =)
пробелы в адресе естесственно убрать.
ЗЫ если нужно добавить поиск из определённого региона - добавляйте &lr= [номер региона] (для Москвы например 213)
ТС, признавайся, ну так что, спамим Slaed чтоли?
Можно всё делать чтобы тебе не забили гол, но если его тебе уже забили - нада признаваться, это по-мужски ))
В том и дело, смотрим ЯК по убыванию тИЦ:
СМИ периодика начинается с 21К у Газеты.ру, Информационные агентства - с 25К у РИА-Новости,
Рубрика Бизнес-Недвижимость - первое место irn с 11К, Финансы - РБК - 19 тысяч и т.д.
Власть: gov.ru 30К, дальше РГ - 15, Сайт Президента РФ 14К.
livinternet 26К
vkontakte 29К
Нашёл только livejournal - тИЦ 39К, ну и гов.ком. Где ещё поискать? ;)
PS Деньги на покупку есть, но покупать обещания и заверения не хочу, в азартные игры не играю, кот в мешке тоже не то, надо разобраться сначала, посмотреть товар лицом...
Таких сайтов не так много, подскажите парочку? Кроме вконтакте и ливжорнал
Не думали продать технологию Сапе? ;)
Предварительно договорились с sabotage.
Актуальность OFF
Проблемы только с бесплатными доменами net.ru org.ru и т.п., обычные рушки съедает активно
По поводу веса. ТС поищите теорию про переколдовку запроса. (Когда то показывали и это) Редкие слова имеют имеют максимальный вес. Вы ошибаетесь с точностью наоборот здесь:
Это к Свете Смирновой вопрос