wolf

wolf
Рейтинг
1183
Регистрация
13.03.2001
Должность
интернет-маркетинг, SEO
А использует ли Яндекс такой фактор, как вес слова или фразы в базе сайта? Например, на сайте на каждой странице по четыре раза встречается "математическая статистика". Яндекс составляет индекс для каждого сайта, смотрит процент ключевых вхождений данного запроса и если он высок (точнее находится в некоторых пределах во избежание поискового спама) - повышает сайт в результатах поиска.

Есть такой большой фактор (номер 2 в моей схеме) - релеванстность содержимого документа запросу. Она вычисляется на основе множества подфакторов - внутридокументная частота, вхождение слов фразы в некие теги и атрибуты (title, keywords, description, alt и т.п.), в участки текста выделенные с помощью элементов офрмления (<h1>...<h6>, <b>, <i> и т.п.) и прочая и прочая. Вот в рамках вычисления значения этого фактора и могут использоваться упомянутые вами вещи.

midian777, эткуйня. Проверенно занусси (c)

А когда-то в 2000-м этот фактор рулил. :)

Количество и ранг ("авторитетность") всех страниц сайта с этим словом

Этот фактор если еще и влияет, то очень и очень слабо. Пренебрежимо мало по сравнению с тремя основными.

Почему-то мне ну совсем никак не верится, что ничего принципиально нового не придумывается.

Наверняка придумывается. Только выкатывать это никто из стариков не решится. Все юзают старый добрый проверенный PageRank плюс ссылочное ранжирование (associated anchortext). Революцию может сделать только новичок, которому нечего терять. Как Гугль в 1999-м. Кстати, есть альтернатива PageRank'у - алгоритм HITS Кляйнберга (он еще как Hilltop в некоторых работах фигурирует). Его использует Teoma. Но революции тут особой нет - просто статический ранг документа заменен на динамический.

Да пока если и фильтруют, то не очень получается. Качественного скачка нет.

Ну, дык филтры постепенно добавляются, да и любой фильтр довольно быстро вычисляется и обходится. Вон, яндекс сквозняки фильтрует, и что в итоге? Все бросились скупать одиночные ссылки с морд.

Второе - никаких новинок уже давно нет. Немного туда-сюда параметры гоняют, не более того.

Похоже, вектор развития поисковых алгоритмов на данном этапе - фильтрация искусственных ссылок при учете факторов 1 и 3. Тут могут и новые факторы появляться, например, такие как, например, возраст домена (песочница для молодых сайтов в Гугле) и т.п.

Миша, не сердись, а как определить - совпадает по тематике или нет?

А тут должна быть в наличии большая матрица соответсвия всех определяемых тематик.

Ладно, всё, будем считать, что полдоклада я прочёл дистанционно. Поеду в больницу жену проведывать.

Но "яндекс умеет определять тематику документа, но пока очень плохо. Поэтому мы не пользуемся такой возможностью." (c) Сегалович, не дословно...

Миш, немного не так. На мой вопрос "Умеет ли Яндекс на лету определять тематику документа и используется ли она при ранжировании?" Илья Сегалович ответил, что про ранжирование он ничего не комментирует, а по поводу умеет ли, да умеет, но очень плохо. :)

Плюс еще у Яндекса свой каталог имеется. Если сайт А ссылается на сайт Б, и оба находятся в каталоге - проблема определения тематики вообще не встает.

Еще раз подчеркну, речь идет о тематике документов, а не сайтов!

Свойство - следствие определения, так каково оно?

Скажем так, конкурентность запроса заключается в количестве ресурсов на достижение приемлемой релевантности по нему. :)

Всего: 24501