Дык какие проблемы? Просто думаю правильно будет отделить парсер Я.Каталога и все остальное, что просто юзает напаршеные urls.
Мне тоже не понятно. Я всегда просто урлы из нужной категории в избранное добавляю, а потом "Только сайты из избранного" флажок при поиске ставлю....
Э... не понял.
Парсим каталог, и на каждый сайт залазим и выгребаем все мылы, что там найдем?
Ну, это во-первых стоит делать отдельно - список всех урлов по категориям получить не проблема уже сейчас.
А во-вторых - как-то слово "спам" вспомнилось...
Зачем мне например мылы с сайтов по категориям? 🙄
Что-то я когда-то начинал писать...
<?php include_once('IXR_Library.inc.php'); $client = new IXR_Client('http://ping.blogs.yandex.ru/RPC2'); $client->debug = true; if (!$client->query('weblogUpdates.ping', 'Title', 'http://site/', '')) { die('Something went wrong - '.$client->getErrorCode().' : '.$client->getErrorMessage()); } echo '<pre>'; print_r($client->getResponse()); echo '</pre>'; ?>
ну, а гугл уже по IXR_Library.inc.php все что надо подсказывает :)
Так, голая теория... ☝
1. Берем умную прогу. Она наши ключевики мешает с разным текстом, да так хитро (марковские цепи), что текст связный. Не особо читаемый, но... Заливаем на народ, проспамливаем по форумам\гостевым... И через некоторое время этот "сайт", а в простонародье - дор, начинает в топы пробиратся. Как проберется - так траф собирает. Недолго, бывает и пару дней всего - но затрат-то на него почти 0 было... А денег немного (или много) принести успеет. Теперь представьте, что в автоматическом режиме в день 10-20 таких доров пускаются. Так вот, это - цветочки :)
2. Создали сайт (или даже ГС). А Яшка не спешит его индексировать. Что делать? Правильно, генерим сайт с текстом, в котором подмешаны ссылки на все ваши странички. На народ его заливаем, отдаем в аддурилку. И через некоторое время ваш сайт в индексе! Как генерить? Вот отличная штука: http://barykin.com/speed
:)
Я бы написал *.*.ua 🙄
Две дочки. MCT, MCAD, MCTS, MCSA и еще кучка титулов. Думаю, все со мной понятно 😂
Дома где-то было. Посмотрю.
Ну, писать - это конечно перебор, а вот обучить эти самые сети на наиболее "человечески звучащие" словосочетания - это полезно.
Интересно :)
http://www.google.com/views?q=Vista+view:timeline&hl=en&esrch=RefinementBarTopViewTabs&vwdr=2010%20-%202084&sa=N&ct=tlhist
Ну, как и раньше - парсинг урлов, просто теперь еще и в базу-кеш складываешь, так?
Ага, это и сам в планах добавил. Не сложно, сделаю.
Так, поглядел на твой парсер - блин, ты теперь и в базе хранишь? ;)
Только вот тИЦ не собирается, регион и т.д, так?
Да и вторая страница у меня в категории не открылась чего-то...
http://barykin.com/yca/tungrp/cat/Science/Secondary_Education/Pre-School/1.html