Сколько времени обычно висит бот поисковика на странице?

pelvis
На сайте с 01.09.2005
Offline
345
962

Интересует, сколько времени проводит краулер на одной странице после того, как он взял контент. Думаю, что дорвейщики лучше всех ответят на данный вопрос. Поисковики: Яндекс и Гуголь.

Продаю вывески. Задарма и задорого (https://www.ledsvetzavod.ru/)
.:nbd:.
На сайте с 04.11.2008
Offline
98
#1

Бот индексатор, не висит на страницах. Отправка get запроса => получение кода страницы => если страница найдена и она изменилась с момента прошлой индексации, сохраняет результат, иначе переходит к следующему пункту => отправка get запроса следующей странице.

Это вариант без редиректов и прочих редких ситуаций.

Палю тему Дорген (/ru/forum/439165) + кеи + контент (http://datarama.biz/) + еще немного кеев и скриптов (http://amazingsoftware.ru/) = $$$ Мы делаем доры, а не пишем романы (c) один Дима рефка dino_spomoni (http://goo.gl/w62v3)
pelvis
На сайте с 01.09.2005
Offline
345
#2
.:nbd:.:
получение кода страницы

Меня интересует время после этого момента.

BredoGen.
На сайте с 19.10.2009
Offline
98
#3
pelvis:
Интересует, сколько времени проводит краулер на одной странице после того, как он взял контент.

Временем нахождения на странице можно считать только время, за которое бот эту страницу скачает.

Далее эта страница, скорее всего сразу же сохраняется на сервере у яндекса, анализируется уже позже.

А что касается паузы между обращениями бота к страницам (время "нахождения" бота на странице), так это зависит от того, что указал вебмастер в robots.txt (параметр Crawl-delay http://help.yandex.ru/webmaster/?id=996567#1022359).

BLACK_DANTE
На сайте с 24.03.2007
Offline
188
#4

Мало, очень мало.

Если сайт свежий, то Яндекс каждую секунду-две заходит на новую страницу.

Рамблер у меня один раз вообще просканировал весь сайт со скорость 5-7 страниц в секунду.

За гуглей не слежу.

Будьте людьми.
O
На сайте с 08.08.2007
Offline
43
#5

Ну вообще-то это узнать невозможно. Т.к. под "висит на странице" подразумевается на самом деле время на обработку страницы, которое невозможно узнать в силу особенностей протокола HTTP.

Сети сателлитов под заказ, дешево! (/ru/forum/524120) Регистрация .net.ru, .org.ru, .pp.ru (/ru/forum/509845) Магазин готовых сайтов в индексе (/ru/forum/545427)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий