Где - там? Ты, опять таки, случайно, PageRank с HITS не путаешь?
Матрица-то, ну, очень сильно разреженная будет всё-таки. И, я думаю, численно решить ее вполне возможно, тем более при гуглевских вычислительных мощностях.
Не путай PageRank и другие факторы, учитывающиеся при определении релевантности. Мы здесь обсуждаем только чистый PageRank - ранг страницы, величина не зависящая от запроса.
Что ты называешь "вероятностью ухода со страницы"? Величину (1-d)? Тогда почему вероятность ухода со страницы является слагаемым при вычислении вероятности ее посещения PR? ;)
Недавно переезжало с одного сервера на другой несколько сайтов один за другим. Специально смотрел логи по старому и новому месту прописки. Так вот, хотите верьте, хотите - нет, ни один робот ведущих поисковиков (в т.ч. и googlebot) не приперся на старое место уже начиная со следующего дня после переезда. Только какая-то шушера тыкалась.
Думаю, причину не в тайтлах надо искать. Сделаю смелое предположение. Похоже наказывают тех, кто "переборщил" с употреблением ключевых фраз в ссылках на документ. Помните, пару лет назад Сегалович здесь рассказывал об интересном фильтре Яндекса, который определяет процент встречаемости определенной ключевой фразы в тексте всех ссылок на документ, и если он меньше некоего нижнего порогового значения, то ссылки, содержащие эту фразу, при ссылочном ранжировании в поиске по этой фразе не учитываются? Вполне возможно, может существовать подобное ограничение не только снизу, но и сверху, то есть фильтровать те фразуы частота употребления которых в ссылках на документ выше некоего верхнего порогового значения. Вполне возможно, что Гугль просто мог опустить планку для этого верхнего порога. И многие ссылки, которые раньше учитывались, отфильтровались и перестали помогать документам. В таком случае, можно порекомендовать срочно расставлять ссылки с нейтральными текстами, дабы уменьшить общую концентрацию "нужных" фраз и вывести их из под действия фильтра.
Может. И помогает, правда меньше, чем заголовок.
Но в том-то и дело, что не для всех подобных страниц этот фильтр работает. Факт!
Угу. А главное, как всегда, не как отловить и опросить, а как потом ответы посчитать. ;)
Гы, да вместо этого ключа, оказывается, можно использовать любую абракабру с минусом перед ней, например, -nyjmi88o :) Что-то тут не так...
Тогда это не фильтр получается, а фигня какая-то, которая кому-то повышает ранг, а кому-то понижает. Наблюдаю следующую картину по некоему запросу в 6 млн. результатов:
запрос к ключом -mt-tb.cgi. запрос без ключа документ "А" 4 место 13 место документ "В" 7 место 7 место документ "С" 11 место 5 место
Документы "А" и "С" лихо перескакивают через голову остающего на месте документа "В" туда и обратно. :)
Может, ссылки на эти страницы где-нибудь остались, и он их по этим ссылкам и находит.
И, на последок, еще неплохая статейка: Amy N.Langville and Carl D.Meyer. Fiddling with PageRank. Прошу обратить внимание на п. 3.2. The Linear System Formulation. Кстати, очень любопытно наличие коэффициента у единичного столбца свободных членов (1-а)/n. Об этом я и говорил несколькими постами выше.