TF-IDF, насколько актуален в российских ПС?

b3rsus
На сайте с 09.03.2016
Offline
63
596

Что за зверь такой, насколько полезен?

Какие могут быть допустимые отклонения, да и от кого (от ТОП-10 или близлежащих по выдаче сайтов)?

И как быть с теми ключами, которые явно превышают значения конкурентов, но сами по себе мусорны и не несут в себе полезной нагрузки?

богоносец
На сайте с 30.01.2007
Offline
753
#1

Зверь старый.

Отклонения могут быть какими угодно.

SmileP
На сайте с 18.02.2010
Offline
386
#2
b3rsus:
Какие могут быть допустимые отклонения

Довольно большие. По % отдельных слов в зависимости от контента (это важно, контент- не только статья) до 15% (максимальное вхождение слова из поискового запроса) доходило.

БМ25 был более или менее актуален наверное лет 10 назад. По некоммерческой выдаче были небольшие корреляции.

В целом в Гугле тупой подсчет вхождений работает лучше, чем в Я-се.

b3rsus:
И как быть с теми ключами, которые явно превышают значения конкурентов, но сами по себе мусорны и не несут в себе полезной нагрузки?

Что значит мусорные?

Если мало по ним показов- то и шут с ним. Если про несоответствии нормам написания, то это не мусор. Почитайте:

http://romip.ru/romip2006/03_yandex.pdf

Алгоритм текстового ранжирования Яндекса на РОМИП-2006

http://www.altertrader.com/publications21.html

Моделирование алгоритма текстового ранжирования Яндекса при помощи MatrixNet.

Но это тоже древнее)

vvovvo
На сайте с 01.06.2012
Offline
180
#3

Мне кажется, что тема с TF-IDF уже устарела и алгоритмы поисковиков ушли далеко вперёд.

Google News and Google Discover SEO.
SmileP
На сайте с 18.02.2010
Offline
386
#4
vvovvo:
Мне кажется,

Посмотрите ТОП ;) И не будет казаться.

Ну и в целом не то что отменили TF-IDF, скорее стали по другому учитывать+ появились другие факторы.

b3rsus
На сайте с 09.03.2016
Offline
63
#5
SmileP:
Довольно большие. По % отдельных слов в зависимости от контента (это важно, контент- не только статья) до 15% (максимальное вхождение слова из поискового запроса) доходило.
БМ25 был более или менее актуален наверное лет 10 назад. По некоммерческой выдаче были небольшие корреляции.
В целом в Гугле тупой подсчет вхождений работает лучше, чем в Я-се.


Что значит мусорные?
Если мало по ним показов- то и шут с ним. Если про несоответствии нормам написания, то это не мусор. Почитайте:
http://romip.ru/romip2006/03_yandex.pdf
Алгоритм текстового ранжирования Яндекса на РОМИП-2006

http://www.altertrader.com/publications21.html
Моделирование алгоритма текстового ранжирования Яндекса при помощи MatrixNet.

Но это тоже древнее)

Спасибо за конструктивный и интересный ответ. Однако, как я понимаю, за 12 лет алгоритмы всё-таки серьёзно изменились=)

Тем не менее, во многих бурж ресурсах частенько встречаю статьи о необходимости учёта (а то и руководства!) TF-IDF.

Тогда вопрос, возможно несколько некорректный - что лучше в приоритете держать, количество точных вхождений с учётом анализа конкурентов, либо же пресловутую оптимизацию по TF-IDF с учётом нужного количества упоминаний (а так же +- динамики по остальным словам конкурентов).

SmileP
На сайте с 18.02.2010
Offline
386
#6
b3rsus:
Тем не менее, во многих бурж ресурсах частенько встречаю статьи о необходимости учёта (а то и руководства!) TF-IDF.

В гугле оно лучше работает. ИМХО, там нужно вхождение точных фраз (с учетом языка). В Я-се не так обязательно наличие большого числа точных вхождение всей фразы целиком (вхождений по словам бывает достаточно, если конкуренция не высокая).

Разделяйте вхождение фраз, отдельных слов из них. И в каком типе контента они находятся.

b3rsus:
либо же пресловутую оптимизацию по TF-IDF с учётом нужного количества упоминаний (а так же +- динамики по остальным словам конкурентов).

Скорее это. Но оно работает плохо, если сам сайт "плохой" (дорвеи, сайт- псевдомагазин без коммерческих факторов.). "Хорошие" сайты в Я-се могут вполне быть в ТОП-е без вхождения отдельных слов (не говоря о точном вхождении фразы), даже если есть "плохие" сайты с текстами с точными вхождениями.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий