? по текстовому ранжированию

zZmeIOka
На сайте с 30.05.2007
Offline
269
987

Привет-привет, камрады! ;)

Вопрос по поводу анализа текстов, проводимого Яндексом (особенно интересно мнение камрада Goodman ;) ).

В принципе все запросы к ПС условно можно разделить на крупные категории - коммерческие ("фигня купить"), информационные ("описание фигни", "инструкция по использованию фигни") и условно-коммерческие ("фигня").

Насколько я понимаю, для текстового ранжирования Яндекс должен использовать некий механизм лингвистического анализа для определения принадлежности документа к той или иной категории. Верно ли утверждение: если сравнивать два голых документа, будет ли документ с чисто коммерческой направленностью ранжироваться выше документа со смешанным содержанием (например, который помимо собственно некоего рекламного месседжа будет содержать еще и описание товара, правила использования и другие фрагменты, которые можно отнести к категории информационных запросов) в случае коммерческого и условно-коммерческого запросов и ниже в случае информационного запроса?

G00DMAN
На сайте с 19.04.2008
Offline
122
#1

Утверждение не верно. Такого разделения запросов вроде не наблюдается пока.

Разделение по гео к коммерции не имеет отношения, там по-другому все делится на кучки. :)

Если запрос "фигня купить" - геозависимый, а "описание фигни" и "фигня" геонезависимые, то документ по ним может находиться совершенно на разных позициях не из-за своей коммерческой составляющей, а потому, что параметры в алгоритме ранжирования для разных регионов разные. Т.е. разный вес внешнего ссылочного, текстового и всяких других характеристик документа.

Яндексоиды на самом деле хотят разнообразить выдачу, отдавая в топе не только коммерческие хорошо оптимизировынные страницы, чтобы разнообразие какое-то было. Но красивого алгоритмического решения пока вроде нет, а разнообразить вручную западло. Так что для разнообразия пока искуственно повышаются только разноязычные вики. У гугла по некоторому не малому списку запросов выдача более модерируемая, но это не прикольно, нужно алгоритмически проблему решить, а не руками. :)

Илья Зябрев, AlterTrader Research Ltd. Последние статьи: Об отмене ссылок в Яндексе. (www.altertrader.com/publications38.html)|Поведенческие факторы (формулы) (www.altertrader.com/publications36.html) Жадные алгоритмы Яндекса. (www.altertrader.com/publications20.html)|MatrixNet для «чайников». (www.altertrader.com/publications19.html)
zZmeIOka
На сайте с 30.05.2007
Offline
269
#2

G00DMAN, да, сейчас это очень явно видно, по условно-коммерческим запросам в топе сейчас всегда 9 коммерческих сайтов и вика, в силу своей универсальности ;) Если бы был некий доверенный источник информации, он бы тоже был - для разнообразия. В принципе, наверное это правильный подход... но несколько однобокий.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий