Разъясните про стоп-слова.

Solmyr
На сайте с 10.09.2007
Offline
501
533

Искал в яндексе и на форуме. В Яндексе нашел вот что:

Стоп-слова это распространенные слова, которые игнорируют поисковые машины во время поиска по ключевому слову. Поисковики не обращают на них внимания чтобы сэкономить место на своих серверах и ускорить процесс поиска.

Когда поисковая машина выполняет поиск, она исключает стоп-слова из поискового запроса и заменяет их маркером. Маркер это символ, который заменяет стоп-слова. Цель – сэкономить место на сервере. Таким образом, поисковые машины могут экономить место, сохранять на сервере большее количество веб-страниц и одновременно поддерживать релевантность поисковых запросов.

Пример: "работа в США" это поисковый запрос. В этом случае поисковые машины пометят стоп-слово "в" символом "*" и выполнят поиск "работа * США".

Давайте рассмотрим тот же поисковый запрос "работа в США". Некоторые поисковые машины сохранят все слова, но они исключат определенные употребительные слова из поискового запроса. Это делается для экономии времени. В противном случае им нужно сделать три разных раунда поиска. Один раунд для "работа", один для "в" и последний для "США". Но можно достичь релевантных результатов только по двум словам «работа» и «США», и, следовательно, сэкономить один раунд. Таким образом, чтобы сохранить время поисковики игнорируют некоторые слова.

На форуме вот что: /ru/forum/154811

Но это не правда или не вся правда. Если бы сказанное было правдой то выдача по `работа в США` и `работа на США` была бы одинаковой. А она разная.

Так что такое стоп-слова?

Marvellous
На сайте с 09.02.2006
Offline
130
#1

Части речи игнорируемые поисковыми системами в ввиду их более низкой смысловой нагрузки (в целях экономии ресурсов). Отношение к ним раньше у Яндекса было посредственное, но уже более года назад они стали играть на много большую роль в расчете релевантности. Просто термин появился давно и до сих пор сохранился.

А для меня это части речи не принимающие участия в морфологии поиска, но являющиеся неотемлимой частью поисковых запросов и играющие вспомогательную роль при расчете релевантности документов.

...

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий