Несколько вопросов про парсинг...

X2
На сайте с 26.01.2008
Offline
13
417

Какими способами парсятся поисковики ?

Сколько времени займет отпарсить любой поисковик для 100 страниц ?

Как работают поисовики типа Quanita ?

Сразу говорю, что я не собираюсь делать новый поисковик, но мне это очень нужно знать.

Программист написал скрипт, где 1 запрос паристся по 3-5 минут, хотя парсится только первая страница выдачи ! Это нормально ? :eek:

x102 добавил 14.05.2008 в 20:19

Про это никто не знает штоли ?

SJ
На сайте с 16.03.2008
Offline
78
#1

Смотря что значит "парсится" для вас.

Если просто скажем отправить запрос гуглу и собрать 100 урлов сайтов из ТОП 100 по этому запросу - то тут дольше гугл отвечать будет чем регексп по результату пробежится :)

А вот если еще какой-то анализ дополнительный нужен (например, для каждого еще и ПР, ТИЦ узнать) - то тут вся задержка и будет.

Вобще-то скорость обработки результатов (строк, грубо говоря) в 99% случаев ничтожна по сравнению со временем формирования и получения этих результатов через сеть. А 100 Мегов результата ПС не отдадут ;)

Конечно, программист может посимвольно что-то сравнивать... 😆

Любимый хостинг (http://beget.ru?id=2902) How can we grow old when the soundtrack of our lives is rock-n-roll?
OPTIMER
На сайте с 05.01.2006
Offline
497
#2

x102, все зависит от данных, которые Вы желаете получить и техники :) как технической так и умственной ее части :)

оО Раскрутка сайтов без абон. платы, единоразово от 100.000 руб.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий