Комментарии - wolf - Профиль вебмастера - Форум об интернет-маркетинге

Только без рук)

22 ноября 2005, 13:34

А использует ли Яндекс такой фактор, как вес слова или фразы в базе сайта? Например, на сайте на каждой странице по четыре раза встречается "математическая статистика". Яндекс составляет индекс для каждого сайта, смотрит процент ключевых вхождений данного запроса и если он высок (точнее находится в некоторых пределах во избежание поискового спама) - повышает сайт в результатах поиска.

Есть такой большой фактор (номер 2 в моей схеме) - релеванстность содержимого документа запросу. Она вычисляется на основе множества подфакторов - внутридокументная частота, вхождение слов фразы в некие теги и атрибуты (title, keywords, description, alt и т.п.), в участки текста выделенные с помощью элементов офрмления (<h1>...<h6>, <b>, <i> и т.п.) и прочая и прочая. Вот в рамках вычисления значения этого фактора и могут использоваться упомянутые вами вещи.

Только без рук)

22 ноября 2005, 13:12

midian777, эткуйня. Проверенно занусси (c)

А когда-то в 2000-м этот фактор рулил. :)

Только без рук)

22 ноября 2005, 13:07

Количество и ранг ("авторитетность") всех страниц сайта с этим словом

Этот фактор если еще и влияет, то очень и очень слабо. Пренебрежимо мало по сравнению с тремя основными.

Только без рук)

22 ноября 2005, 13:05

Почему-то мне ну совсем никак не верится, что ничего принципиально нового не придумывается.

Наверняка придумывается. Только выкатывать это никто из стариков не решится. Все юзают старый добрый проверенный PageRank плюс ссылочное ранжирование (associated anchortext). Революцию может сделать только новичок, которому нечего терять. Как Гугль в 1999-м. Кстати, есть альтернатива PageRank'у - алгоритм HITS Кляйнберга (он еще как Hilltop в некоторых работах фигурирует). Его использует Teoma. Но революции тут особой нет - просто статический ранг документа заменен на динамический.

Только без рук)

22 ноября 2005, 12:59

Да пока если и фильтруют, то не очень получается. Качественного скачка нет.

Ну, дык филтры постепенно добавляются, да и любой фильтр довольно быстро вычисляется и обходится. Вон, яндекс сквозняки фильтрует, и что в итоге? Все бросились скупать одиночные ссылки с морд.

Только без рук)

22 ноября 2005, 12:56

Второе - никаких новинок уже давно нет. Немного туда-сюда параметры гоняют, не более того.

Похоже, вектор развития поисковых алгоритмов на данном этапе - фильтрация искусственных ссылок при учете факторов 1 и 3. Тут могут и новые факторы появляться, например, такие как, например, возраст домена (песочница для молодых сайтов в Гугле) и т.п.

Только без рук)

22 ноября 2005, 10:05

Миша, не сердись, а как определить - совпадает по тематике или нет?

А тут должна быть в наличии большая матрица соответсвия всех определяемых тематик.

Ладно, всё, будем считать, что полдоклада я прочёл дистанционно. Поеду в больницу жену проведывать.

Только без рук)

22 ноября 2005, 09:44

Но "яндекс умеет определять тематику документа, но пока очень плохо. Поэтому мы не пользуемся такой возможностью." (c) Сегалович, не дословно...

Миш, немного не так. На мой вопрос "Умеет ли Яндекс на лету определять тематику документа и используется ли она при ранжировании?" Илья Сегалович ответил, что про ранжирование он ничего не комментирует, а по поводу умеет ли, да умеет, но очень плохо. :)

Только без рук)

22 ноября 2005, 09:35

Плюс еще у Яндекса свой каталог имеется. Если сайт А ссылается на сайт Б, и оба находятся в каталоге - проблема определения тематики вообще не встает.

Еще раз подчеркну, речь идет о тематике документов, а не сайтов!

Только без рук)

22 ноября 2005, 09:34

Свойство - следствие определения, так каково оно?

Скажем так, конкурентность запроса заключается в количестве ресурсов на достижение приемлемой релевантности по нему. :)

Переиграть и победить: как анализировать конкурентов для продвижения сайта

В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи

wolf