Стоп-слова

dimmu-borgir
На сайте с 16.03.2009
Offline
170
499

Из вики-серча:

Слова, не несущие самостоятельной смысловой нагрузки. Как правило, к ним относятся предлоги, союзы, частицы, местоимения, вводные слова, междометия, предикативы. Для уменьшения размера индекса поисковой системы стоп-слова не включаются в индекс и не учитываются при поиске.

У меня вопрос по последней части определения- не учитываются при поиске на сколько это верное утверждение?

Слышал 2 теории, которые хочу либо опровергнуть, либо подтвердить-

1. При оценки тошноты текста/процента вхождения ключей, стоп-слова не должны опережать ключи. Не зря ведь многие сервисы показывают процент вхождения стоп-слов.

Пример:

в 7%

на 5%

для 5%

КЛЮЧ n%

КЛЮЧ n%

2. Если стоп-слов "слишком мало", тоесть их искусственно проредили, то текст может быть определен как спамный/автосгенерируемый. Соответственно санкции.

___________

Или же возвращаясь к определению- не учитываются при поиске и не стоит вообще на них смотреть.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий