Стоп слова.

Шут
На сайте с 16.08.2005
Offline
9
1129

Какие стоп слова в Яндексе (на самом деле)?

Например, в «дистрибутиве с Яндексом» идут (шли) такие:

1. (английские) i, he, to, of, and, in, is, it, for, that, if, you, this, be, on, with, not, have, are, or, as, from, can, but, by, at, an, will, no, all, was, do, there, my, one, so, we, they, what, would, any, which, about

2. (русские) а, большой, бы, быть, в, весь, вот, все, всего, вы, говорить, год, да, для, до, еще, же, знать, и, из, к, как, который, мочь, мы, на, наш, не, нет, но, о, один, он, она, они, оно, от, по, с, свой, себя, сказать, такой, только, тот, ты, у, что, чей, это, я

Вопрос, учитываются ли стоп слова (приведенные) в подсчете веса слова? Они как-то влияют на текст?

У кого какие мнения?

Bor-ka
На сайте с 16.11.2004
Offline
201
#1

думаю на общий вес документа влияют, это же индексируемый текст. да и в запросах тоже влияют, хотя не всегда явно видно.

Из приведенного Вами списка проводим эксперимент:

запрос "холодильник" и "большой холодильник" - две абсолютно разные выдачи.

немного разные выдачи например по "холодильник кухня" и "холодильник и кухня".

все сугубо имхо.

Сервис полуавтоматического рерайта текста (http://topwriter.ru/)
Vetra
На сайте с 07.04.2005
Offline
200
#2

стоп-слова

десять

K
На сайте с 31.01.2001
Offline
737
#3
немного разные выдачи например по "холодильник кухня" и "холодильник и кухня".

Это неудивительно, ведь большое значение придается расстоянию между словами, а оно в этих запросах разное. Если вы во втором запросе вставите в середину любое другое стоп-слово, выдача не изменится (совсем).

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
Bor-ka
На сайте с 16.11.2004
Offline
201
#4
Это неудивительно, ведь большое значение придается расстоянию между словами, а оно в этих запросах разное. Если вы вставите в середину любое другое стоп-слово, выдача не изменится (совсем).

смотрим "холодильник и кухня" и "холодильник в кухня". выдача то отличается, проверьте сами :) расстояния одинаковые в запросах.

K
На сайте с 31.01.2001
Offline
737
#5

ща посмотрим. Ну, с 1 по 6 место у меня одинаковая. На 7 место кто-то вклинился, но очень похоже.

Если убрать слово из середины, отличие уже сильное, начиная со 2 места.

Shunya
На сайте с 12.11.2003
Offline
132
#6
Bor-ka:
смотрим "холодильник и кухня" и "холодильник в кухня". выдача то отличается, проверьте сами :) расстояния одинаковые в запросах.

Одно… э… оно… затисалось в первую десятку.

Глюк? Остальное – тоже.

продвижение сайта в поисковых системах (http://www.1seo.ru/) бухгалтерские услуги (http://www.audito.ru/)
Bor-ka
На сайте с 16.11.2004
Offline
201
#7

вот еще пример.

"синхрофазотрон в энциклопедия"

и

"синхрофазотрон и энциклопедия"

здесь больше различий. Соответственно данные слова учитываются, слабо, но учитываются. сугубо имхо. Уважаемые гуру поправят, если я заблуждаюсь.

M
На сайте с 12.05.2005
Offline
133
#8
Shunya:
Одно… э… оно… затисалось в первую десятку.Глюк? Остальное – тоже.

Домыслы следующие: Стоп слова в поисковом выражении учитывается при обработке запроса один раз в отличие от весовых слов, учитывающихся дважды. Т.е. при выборке по кворуму стоп слова не учитываются, но учитываются при дальнейшем ранжировании результатов с учетом (внешних ссылок, видимости ....). Может я не прав, но выглядит всё так.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий