Простой скриптик в помощь "статейщикам"

HH
На сайте с 31.03.2005
Offline
46
440

Написал для себя, ни на что не претендую, тем, кто часто ищет площадки под статьи может быть полезно :)

Алгоритм скрипта простой:

1. Парсим нужную категорию ЯК-а

2. Ищем в гугле вхождения типа "разместить статью" и.т.д. на выпарсенных сайтах

3. Отдаём ссылки, где нашлось.

Ясно, что находим таким образом только официальные объявления о размещении, но на безрыбье может кому и пригодится.

Если кто расширит поисковые фразы, буду только благодарен.


<?
$url = "http://yaca.yandex.ru/yca/cat/Business/Construction/"; //Нужная категория ЯК-а
$link_patern = '/<span style="([^"]+)">([^<]+)<\/span><span class="black">/'; //Регулярка для яка
$google_reg="/<span class=a>([^ ]+) -/"; //регулярка для гугла
$timeout = '20'; //таймаут запросов к ЯКу
$pagecount = 100; //Кол-во страниц в ЯКе для парсинга
for ($i=0;$i<$pagecount;$i++) {
sleep($timeout);
$content = join(file($url."".intval($i).".html"));
preg_match_all($link_patern,$content,$regs);
for ($j=0;$j<count($regs[2]);$j++) {
$yacurl = trim($regs[2][$j]);
$googleurl="http://www.google.ru/search?q=site%3A".$yacurl."++%28%22%D1%80%D0%B0%D0%B7%D0%BC%D0%B5%D1%81%D1%82%D0%B8%D1%82%D1%8C+%D1%81%D1%82%D0%B0%D1%82%D1%8C%D1%8E%22+OR+%22%D1%80%D0%B0%D0%B7%D0%BC%D0%B5%D1%89%D0%B5%D0%BD%D0%B8%D0%B5+%D1%81%D1%82%D0%B0%D1%82%D0%B5%D0%B9%22+OR+%22%D1%80%D0%B0%D0%B7%D0%BC%D0%B5%D1%89%D0%B5%D0%BD%D0%B8%D0%B5+%D1%81%D1%82%D0%B0%D1%82%D1%8C%D0%B8%22+OR+%22%D0%BE%D0%BF%D1%83%D0%B1%D0%BB%D0%B8%D0%BA%D0%BE%D0%B2%D0%B0%D1%82%D1%8C+%D1%81%D1%82%D0%B0%D1%82%D1%8C%D1%8E%22+OR+%22%D0%BF%D1%83%D0%B1%D0%BB%D0%B8%D0%BA%D0%B0%D1%86%D0%B8%D1%8F+%D1%81%D1%82%D0%B0%D1%82%D0%B5%D0%B9%22%29";
$g_content = join(file($googleurl));
if (preg_match_all($google_reg,$g_content,$g_regs)) {
print $g_regs[1][0]."\n";
}
}
sleep($timeout);
}
?>
Рецепты от HabaHaba (http://www.haba-cooking.ru/)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий