В том то и дело. В принципе, если на странице есть невозвращающаяся ссылка (т.е. когда нет сколь уголно длинной цепочки страниц, по которой можно прийти с цитируемой страницы на ссылающуюся), PR ссылающейся страницы должен уменьшиться. Но, чтобы, он уменшился довольно существенно, я думаю, таких невозвращающихся ссылок должно быть, ну, очень много.
Вообще, должен все обходить. Но может быть, страницы с очень низким PR обходятся реже для снижения нагрузки роботов?
Однако дата обновления показывается Яндексом именно для второго, так как у него в заголовке есть поле Last-Modified
Почему он должен именно перетекать? Алгоритм PageRank не учитывает исходящие ссылки, он учитывает только входящие. Другое дело, что должна быть некая постоянная величина - что-то типа суммарного PR всех документов, которая перераспределяется по ним в зависимости от структуры ссылок между ними. Но здесь нельзя утверждать, что конкретная исходящая ссылка может как-то значимо повлиять на PR страницы.
И причем здесь внутренние и внешние ссылки? Для алгоритма PageRank абсолютно безразлично к какому сайту принадлежит страница. Он работает не с сайтами, а со страницами!
Послушаем с удовольствием. Кстати, RAX предоставляет открытую глобальную статистику по поисковым системам и каталогам. Только вот сайтов RAX'ом обрабатывается поменьше, чем Спайлогом
Вопрос №1. С какого IP запускается робот? Не возникнет ли у пользователя анализатора проблем с поисковиками, которые могут привести к бану IP пользователя? Те же Яндекс и Гугль прямо утверждают на своих сайтах о недопустимостим работы каких-либо анализаторов позиций с их поисковыми базами, кроме как по специальной договоренности.
Вопрос №2. К топпинговскому анализатору было много нареканий по поводу того, что он неверно определяет позиции сайтов в некоторых случаях. Были ли сделаны какие-то усовершенствования программы в этом плане?
P.S. Вопрос №2 снимается после прочтения постинга Вячеслава в другом топике
На русском - не знаю, а на английском - www.cs.cornell.edu/home/kleinber/auth.pdf
По-моему, первое. Алгоритм Яндекса (на основе PageRank) не учитывает исходящие ссылки со страниц. А вот, к примеру, алгоритм HITS, использующийся западной поисковой системой Teoma, для определения "важности" страницы учитывает количество и качество как входящих, так и исходящих ссылок. Вот для позиционирования в ней подобные действия могли иметь какой-нибудь смысл. Только она русский язык не понимает :D
P.S. Кстати, не означают ли давно муссирующиеся слухи о переходе Яндекса на тВИЦ того, что в Яндексе подумывают о замене алгоритма PageRank на HITS? Ведь в нем на основе информации о входящих и исходящих ссылках строятся тематические кластеры внутри которых вычисляются для каждой страницы коэффициенты, являющиеся аналогами так ожидаемого некоторыми товарищами тВИЦ'а.
А еще говорят, знал бы прикуп - жил бы в Сочи
У меня выдачи идентичны