Да ктож тебе скажет каким образом :) Научных и околонаучных работ про определение качества и естественность текста при желании можно нагуглить сколько угодно, но что именно используется не каждый яндексоид и гуглоид знает поди.
Что непосредственно до "воды", вероятно ни Яндекс, ни Google не используют значение "воды", которое показывает адвего, т.к. пузомерка весьма сомнительная:
Взял отсюда, какие слова они считают не значимыми, а какие значимыми - не понятно. А даже если бы и было понятно, то совсем не много шансов, что поисковики считают теже слова значимыми и считают другие значимыми. Но из списка фичей очевидно, что-то из этого рода они считают :)
Вполне себе может учитываться в 334-336, 369-370, 399-403 ;)
kRt, ранжирование и антиспам - это как бэ разные вещи. Вы пишите про BM25 и рекомендуете разбавить <title> - это и есть глупость, т.к. по запросу [Купить слона] максимальный вклад в релевантность даст именно <title>Купить слона</title>.
Такое ощущение, что вы сами не понимаете о чем пишете. С одной стороны рекомендуете ориентироваться на BM25, а с другой стороны разбавлять <title> дополнительными ключевыми словами. Чем больше вы его разбавите, тем больше по сути у вас будет "длина документа" и тем меньшее значение релевантности по BM25 вы получите.
Не, выкладывали тоже 13
Мих, а "более новый" от какого года? :)
Для ВКонтакте теперь тоже добавились иконки, пример [егэ по русскому языку 2015 новости]
Yoko999, ранжирования чего и на основе чего?
Как-то вы мутно вопрос задали... Если я правильно понял, то берите любые алгоритмы текстового ранжирования, самое простое - Okapi BM25, ну или вот несколько статей:
Если сравнивать с сервисом r-tools.org, можете описать чем ваш софт выделяется?
mamakadze, вряд ли это робот, который анализирует страницы для закупки ссылок, скорее всего это их индексатор рунета, так что можете блочить ;)