Стемминг для русских слов?

wolf
На сайте с 13.03.2001
Offline
1183
918

Наткнулся на следующие результаты:

http://www.google.com/search?q=%EC%E5%E4%E8%E0%2D%EF%EB%E0%ED%E8%F0%EE%E2%E0%ED%E8%E5

Сравните с http://www.google.com/search?q=%22%EC%E5%E4%E8%E0%2D%EF%EB%E0%ED%E8%F0%EE%E2%E0%ED%E8%E5%22

Если это не стемминг, то что же?

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
Z
На сайте с 03.01.2004
Offline
32
#1

Нет, эт не стеминг. Гугл по-другому относится к общим словами и знакам пунктуации внутри двойных кавычек (во фразах).

Cossack
На сайте с 17.12.2002
Offline
279
#2

Чем бы дети не тешились, лишь бы не дрались... а так:

http://www.google.com/search?hl=ru&ie=windows-1251&c2coff=1&q=%7E%EC%E5%E4%E8%E0%7E%EF%EB%E0%ED%E8%F0%EE%E2%E0%ED%E8%E5&btnG=%CF%EE%E8%F1%EA+%E2+Google&lr=

не пробовали?

Прощание славянки... (http://www.youtube.com/watch?v=0xf9lFMWfKw)
wolf
На сайте с 13.03.2001
Offline
1183
#3
Нет, эт не стеминг. Гугл по-другому относится к общим словами и знакам пунктуации внутри двойных кавычек (во фразах).

Да это-то известно. Тут же фишка в том, что при запросе медиа-планирование, состоящим из двух слов, Гугль учитывает слово медиапланирование, чего раньше не было.

Z
На сайте с 03.01.2004
Offline
32
#4
Как писал wolf


Да это-то известно. Тут же фишка в том, что при запросе медиа-планирование, состоящим из двух слов, Гугль учитывает слово медиапланирование, чего раньше не было.

Больше похоже, что он отлавливает ошибки ввода по словарю. Т.е. кавычек нет, но стоит дефис, а в словаре есть слово без дефиса - значит возможна ошибка при вводе и правит запрос.

Про стеминг можно было бы говорить, если бы он искал также и медиапланирования, медиапланированию и т.д., а этого как раз нет.

wolf
На сайте с 13.03.2001
Offline
1183
#5
Больше похоже, что он отлавливает ошибки ввода по словарю. Т.е. кавычек нет, но стоит дефис, а в словаре есть слово без дефиса - значит возможна ошибка при вводе и правит запрос.

Да, похоже на то:

http://www.google.com/search?q=%EC%2D%E5%E4%E8%E0%EF%EB%E0%ED%E8%F0%EE%E2%E0%ED%E8%E5

http://www.google.com/search?q=%EC%E5%2D%E4%E8%E0%EF%EB%E0%ED%E8%F0%EE%E2%E0%ED%E8%E5

и т.д. дают одинаковые результаты.

wolf
На сайте с 13.03.2001
Offline
1183
#6

Даже словарь тут не при чем. Просто для слов с дефисом ищется также вариант без дефиса, неважно, словарное оно или нет:

http://www.google.com/search?q=%E4%E6%EE%2D%EF%E0 (прошу у дам и детей прощения за пример :))

Z
На сайте с 03.01.2004
Offline
32
#7
Как писал wolf
Даже словарь тут не при чем.

Эт смотря кто как словарь составляет :)

Не суть важно, главное, что он не ищет по запросу страницы со всеми словами общего морфологического корня.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий