Почему яндекс заходит только на страницы, на которые есть ссылки с морды?

1 23
SS
На сайте с 03.09.2004
Offline
141
#21
А скажите по какому принципу ходит робот на сайт(действительно хотелось бы узнать)?

У бота есть некий список страниц, которые надо проиндексировать. Как появился этот список: либо через форму добавили, либо в предыдущий раз бот приходил и ссылок набрал. Индексатор обращается к файлу роботс.тхт и проверяет - какие страницы можно брать, а какие - нет. В соответствии с этим из своего списка он выбирает страницы не запрещенные для индексации и берет их. Таким образом в базу попадает некое множество страниц сайта, но необязательно все.

«Клянусь своей жизнью и любовью к ней, что никогда не буду жить ради другого человека и никогда не попрошу и не заставлю другого человека жить ради меня» (с) Джон Галт
Lenka
На сайте с 10.10.2003
Offline
139
#22
albion:
А в URL тех страниц, которых он брезгует, случайно нет кирилицы.

нет, кирилицы нет.

эх, если бы все было так просто :(

Jet
На сайте с 07.01.2004
Offline
76
Jet
#23

И после всего этого Яндекс называет себя "Зеркалом интернета".... :-/

Если он заглядывает только на страницы. на которые есть ссылки с главной....

T.R.O.N
На сайте с 18.05.2004
Offline
314
#24
И после всего этого Яндекс называет себя "Зеркалом интернета".... :-/

Если он заглядывает только на страницы. на которые есть ссылки с главной....

Слышал звон........ =))

От воздержания пока никто не умер. Хотя никто и не родился! Prototype.js был написан теми, кто не знает JavaScript, для тех, кто не знает JavaScript (Richard Cornford)
S
На сайте с 27.04.2005
Offline
25
#25
Jet:
И после всего этого Яндекс называет себя "Зеркалом интернета".... :-/

Если он заглядывает только на страницы. на которые есть ссылки с главной....

Найдётся всё. Со временем.

T.R.O.N
На сайте с 18.05.2004
Offline
314
#26
А скажите по какому принципу ходит робот на сайт(действительно хотелось бы узнать)?

Конечно имхо, но (надеюсь они не сильно исказили класический алгоритм)

Когда индексация начинается, робот конечно начинает с морды, по проходит по ссылкам. У него лимит времени на сайт. Что успел - то взял. Лимит у разных сайтов - разный. Зависит от многих факторов.

Так продолжается несколько раз, с каким-то интервалом.

Потом, когда накопились данные, робот ходит по сайту, начиная как с морды, так и со страниц с наибольшей частотой обновлений и с большим весом внешних ссылок.

По всей видимости, робот иметт ограничения и на количество ошибок. Если код имеет ошибки и сервак часто возвращает код отличный от 200, бот посто уходит.

Такое часто наблюдается у сайтов, посторенных на движках с "плавающими" страницами, когда страница со временем меняет УРЛ.

(да, здесь я еще не описал проходы быстроробота, робота каталога и т.д.)

Вощем посмотрите расширенные логи сервера, там много станет понятно.

i_am_sorry
На сайте с 18.09.2005
Offline
19
#27
И после всего этого Яндекс называет себя "Зеркалом интернета".... :-/

Если он заглядывает только на страницы. на которые есть ссылки с главной....

Jet, Это лиш частный случай

Lenka, ИМХО ищите ошибки у себя, а не у Я. либо покажите сайт, скорее всего Вам на них укажут.

Lenka, а какая у Вас "глубина" (от морды) до не индексируемых страниц, не считая карты сайты?

- (http://www.doskasearch.ru)С уважением к Вашим достижениям ...
albion
На сайте с 07.10.2005
Offline
247
#28
Конечно имхо, но (надеюсь они не сильно исказили класический алгоритм)
Когда индексация начинается, робот конечно начинает с морды, по проходит по ссылкам. У него лимит времени на сайт. Что успел - то взял. Лимит у разных сайтов - разный. Зависит от многих факторов.
Так продолжается несколько раз, с каким-то интервалом.
Потом, когда накопились данные, робот ходит по сайту, начиная как с морды, так и со страниц с наибольшей частотой обновлений и с большим весом внешних ссылок.
По всей видимости, робот иметт ограничения и на количество ошибок. Если код имеет ошибки и сервак часто возвращает код отличный от 200, бот посто уходит.
Такое часто наблюдается у сайтов, посторенных на движках с "плавающими" страницами, когда страница со временем меняет УРЛ.
(да, здесь я еще не описал проходы быстроробота, робота каталога и т.д.)


Вощем посмотрите расширенные логи сервера, там много станет понятно.

Спасибо за подробный ответ

1 23

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий