wolf

wolf
Рейтинг
1183
Регистрация
13.03.2001
Должность
интернет-маркетинг, SEO
Октуда же там взялись разные типы сайтов, типа hubs и authorities?

Где - там? Ты, опять таки, случайно, PageRank с HITS не путаешь?

а теперь убеждают, что Google в силах решить одновременно 3,307,998,701 уравнений? Эт че? Моделирование ядерного взрыва?

Матрица-то, ну, очень сильно разреженная будет всё-таки. И, я думаю, численно решить ее вполне возможно, тем более при гуглевских вычислительных мощностях.

Правильно, и от чего она зависит? Как определяется? Почему Google любит страницы с текстами и особенно с текстами вверху?
...
Зачем Google анализирует структуру страниц сайтов и хранит их копии?

Не путай PageRank и другие факторы, учитывающиеся при определении релевантности. Мы здесь обсуждаем только чистый PageRank - ранг страницы, величина не зависящая от запроса.

ПОЧЕМУ? Даже чисто математически - вся соль в нем, потому как оно есть вероятность ухода со страницы

Что ты называешь "вероятностью ухода со страницы"? Величину (1-d)? Тогда почему вероятность ухода со страницы является слагаемым при вычислении вероятности ее посещения PR? ;)

Более того много-много раз говорилось о том, что пару недель робот будет ходить по старому IP-адресу.

Недавно переезжало с одного сервера на другой несколько сайтов один за другим. Специально смотрел логи по старому и новому месту прописки. Так вот, хотите верьте, хотите - нет, ни один робот ведущих поисковиков (в т.ч. и googlebot) не приперся на старое место уже начиная со следующего дня после переезда. Только какая-то шушера тыкалась.

Из первой сотни повылетали в основном сайты, титул которых содержит оба слова. Повсплывали сайты титул которых содержит только одно слово из запроса или вообще не содержит их. Не везде, но в целом тенденция такова.

Думаю, причину не в тайтлах надо искать. Сделаю смелое предположение. Похоже наказывают тех, кто "переборщил" с употреблением ключевых фраз в ссылках на документ. Помните, пару лет назад Сегалович здесь рассказывал об интересном фильтре Яндекса, который определяет процент встречаемости определенной ключевой фразы в тексте всех ссылок на документ, и если он меньше некоего нижнего порогового значения, то ссылки, содержащие эту фразу, при ссылочном ранжировании в поиске по этой фразе не учитываются? Вполне возможно, может существовать подобное ограничение не только снизу, но и сверху, то есть фильтровать те фразуы частота употребления которых в ссылках на документ выше некоего верхнего порогового значения. Вполне возможно, что Гугль просто мог опустить планку для этого верхнего порога. И многие ссылки, которые раньше учитывались, отфильтровались и перестали помогать документам. В таком случае, можно порекомендовать срочно расставлять ссылки с нейтральными текстами, дабы уменьшить общую концентрацию "нужных" фраз и вывести их из под действия фильтра.

и описание чем-то может помочь?

Может. И помогает, правда меньше, чем заголовок.

Суть фильтра - если страница оптимизирована под определенную фразу и в тексте ссылок также идет эта фраза, то врядли вы эту страницу увидите наверху поисковой выдачи по этой фразе.

Но в том-то и дело, что не для всех подобных страниц этот фильтр работает. Факт!

Но, вообще, решается этот вопрос достаточно просто - отлавливают сотню-другую новичков и опрашивают.
Если есть желание, займитесь...

Угу. А главное, как всегда, не как отловить и опросить, а как потом ответы посчитать. ;)

Гы, да вместо этого ключа, оказывается, можно использовать любую абракабру с минусом перед ней, например, -nyjmi88o :) Что-то тут не так...

Кстати по поводу фильтра флорида. если кому интересно то можно реальное положение смотреть и без него к поисковой фразе добавляете -mt-tb.cgi.

Тогда это не фильтр получается, а фигня какая-то, которая кому-то повышает ранг, а кому-то понижает. Наблюдаю следующую картину по некоему запросу в 6 млн. результатов:


запрос к ключом -mt-tb.cgi. запрос без ключа
документ "А" 4 место 13 место
документ "В" 7 место 7 место
документ "С" 11 место 5 место

Документы "А" и "С" лихо перескакивают через голову остающего на месте документа "В" туда и обратно. :)

а чего вобще может делать и забыл индесатор на страницах, которых не существует, ведь там же нечего индексировать ?

Может, ссылки на эти страницы где-нибудь остались, и он их по этим ссылкам и находит.

wolf, где сказано о системе уравнений?

И, на последок, еще неплохая статейка: Amy N.Langville and Carl D.Meyer. Fiddling with PageRank. Прошу обратить внимание на п. 3.2. The Linear System Formulation. Кстати, очень любопытно наличие коэффициента у единичного столбца свободных членов (1-а)/n. Об этом я и говорил несколькими постами выше.

Всего: 24501