в частности, для выявления плохо продающихся страниц. а так очень подробная статистика.
да, разумеется, код открыт
возможно еще не обновились DNS. подождите, пожалуйста, несколько минут.
это задержка в секундах в переходе к следующей странице.
возможно яндекс заблокировал ip, попробуйте увеличить $delay.
если не поможет - в самом начале скрипта впишите строку:
set_time_limit(600);
подводя итоги: 0р., 0$, 4 "+", 1 "-" с претензией, мол, зачем выкладывать в паблик?
ну хотя бы для того, чтобы на моих сайтах в sape были тематические ссылки.
это еще pda-версия. а на обычной вообще паттерн фиг напишешь - столько косяков =)
<? $cat = 'Business/Corporate_Services/Business_Contacts/'; $delay = '3'; $url = 'http://pda.yaca.yandex.ru/yca/tungrp/cat/'.$cat; $np_pat = '/<a target="_self" href="(.*)"><font color="#333333">след.<\/font><\/a>/U'; $yc_pat = '/<li>\n<font><a.*href="(.*)".*>.*<\/li>/isU'; echo "<ol>"; while ($data = file_get_contents($url)) { $data = iconv('utf-8', 'cp1251', $data); preg_match_all($yc_pat, $data, $o1, PREG_SET_ORDER); foreach ($o1 as $o) echo "<li>".$o[1]; flush(); preg_match($np_pat, $data, $o2); $url = ($o2 ? $o2[1]:FALSE); sleep($delay); } ?>
работающий парсер Яндекс.Каталога есть здесь: /ru/forum/184296
а также парсер Яндекс.Каталога
http://www.yandex.ru/yandsearch?ras=1&date=within&text=&spcctx=notfar&zone=all&linkto=&wordforms=all&lang=all&within=0&from_day=&from_month=&from_year=&to_day=27&to_month=4&to_year=2007&mime=all&Link=yandex.ru&rstr=&site=&numdoc=10&ds=
все эти сайты имеют ссылку на yandex.ru, но строчки "сохраненная копия" в серпе нет.