Почему Яндекс ориентируется на слабоумных?

12
AiK
На сайте с 27.10.2000
Offline
257
AiK
1267

Почитал я на досуге статью Александра Садовского Как отдохнуть с Яндексом .

И задался я вопросом: а почему собственно Яндекс мнит себя умнее, чем человек, который задаёт вопрос? Почему, если я ищу человека , то мне предлагают результаты поиска людей ?

Вообще-то, было такое детище фирмы Майкрософт (его рождение припысывают жене Билли Гейтса) - Скрепка, которое своими подсказками раздражало хуже некуда. И нормальные люди "душили, душили"... и в итоге задушили. Майкрософт приняла решение отказаться от скрепки.

Интересно, когда к подобному решению придёт Яндекс?

А пока слова блю, бит, бей, Бели, битый возвращаются по одному и тому же запросу .

И я чуть не упал со стула, когда под 12-ым номером обнаружил:


"Яndex" - поиск по "русскому" Интернету
Учёт русской морфологии. Подсветка найденных документов, показ контекстов. Параллельный поиск в Новостях и Товарах. Подписка на запрос. Структурирование поиска по разделам каталога и серверам.
Яндекс бля http://www.yandex.ru/ - 32К - найден по ссылке
Переход в категорию Поисковые системы | Похожие документы | Еще с сервера не менее 1 док

З.Ы: Вопрос, конечно, риторический, а топик, нужно было озаглавить тем определением, которое дали своему поисковику разработчики: "Яндекс бля".

З.З.Ы: интересно засечь время, за которое из результатов поиска по вышеуказанному запросу пропадёт сайт Яндекса?

A
На сайте с 23.11.2000
Offline
166
#1

Не пропадет, Артем! :0) Там написан критерий бля-Яндекса - "найден по ссылке". Можно создать страницу, где прописать ссылки на http://www.yandex.ru/ с "определениями" "Яндекс блин", "Яндекс ептыть", "Яндекс ерш твою медь", "Яндекс охренеть можно"... и через некоторое время и по "ерш твою медь" ту же ссылку увидим. :0)

Вчера по РИКН-рассылке еще более сильная фишка прошла, у меня сначала глаза на лоб полезли, как увидел. :0) http://www.yandex.ru/yandsearch?text=ds+t%2Cfyekbcm

AiK
На сайте с 27.10.2000
Offline
257
AiK
#2

Но это же описание документа!

Если они его составляют на основании ссылок... то что-то подозрительно мало там нехороших слов

Да, конечно сильно искать _такое_ в разделе кльтура и искусство

AiK
На сайте с 27.10.2000
Offline
257
AiK
#3

Свой пост перечитал и понял что мысль была не окончена.

Дык вот, когда мне предлагают в результатах поиска людей, вместо человека, то я обижаюсь. Оно конечно спасибо, но то, что множественное число от "человек" есть "люди" известно любому пятилетнему ребёнку. (Кстати, а почему не сработала аналогия ребёнок=маленький человек)?

Keva тут в очередной раз предлагал сравнить качество поиска... извольте. Я только не буду проверять специальные запросы - не интересно. Берём очень простой запрос человек года

Яндекс:

из первой страницы мы узнаем, что в 1998 году г. Явлинский был человеком года. Оно конечно хорошо, но год-то на дворе какой?

на десятом месте сайт с заголовком: ПМЖ без неглиже " Стихи " Люди, годы, гады

Ясно что дальше будет только хуже.

Рамблер: на первом месте сайт про человека 14-ти лет (интересно, почему в Яндексе не сработало года=лета?)

сайт bestperson.ru только на 6-м месте...

хотя с первой страницы мы узнаём, что по статистике Яндекса(!) - Скуратов человек года (интересно, почему сам Яндекс про себя ничего не знает? склероз наверно)

Апорт:

о, как всё круто! Не открыв ни одной страницы, я знаю, что нынче по разным версиям у нас человек года:

1) Роман Абрамович

2) Митрополит Кирилл

3) Президент Путин

Итак, Апорт - всё путём, Яндекс - с пивом потянет, Рамблер - сразу вспоминается поговорка про Красную Армию.

Ну и напоследок любимый конкурент Гугль:

второе место Програма "ЛЮДИНА РОКУ"...

(он же в Яндексе на 6-м месте), первое, как и положено bestperson.ru

на последнем - ЧЕЛОВЕК ГОДА! Авигдор Либерман – претендент

на звание «Человека года – 2001». (израильский сайт)...

тоже в принципе терпимо.

ну что я скажу... качество поиска таким запросом не оценить конечно, но вот то, что Апорт наиболее удобно оформляет результаты поиска - факт.

Про Рамблер говорить просто стыдно - сплошная каша в результатах.

Яндексу стоит задуматься о том, что произойдёт, если Гугль хотя бы один месяц поспамит журналы и газеты околокомпьютерных тематик своей рекламой...

Выводы: кто меньше выпендривается с морфологией, тот и ищет лучше.

[This message has been edited by AiK (edited 30-11-2001).]

[This message has been edited by AiK (edited 30-11-2001).]

E
На сайте с 05.07.2001
Offline
59
#4

Originally posted by AiK:

Выводы: кто меньше выпендривается с морфологией, тот и ищет лучше.

С выводом не согласен.

Сколько можно составить разных запросов из слов русского языка?

То-то и оно что бесконечное.

И при чем найдется (хотел сказать "все" ;-) некое кол-во запросов, по которым выиграет каждая ПС из 4-ых.

Если их всех (ПС) взвесить со всеми достоинствами и недостатками получим примерно одно и тоже качество.

Кто лучше Би или МТС? Тоже самое.

------------------

Пожалуй этого достаточно.

Пожалуй этого достаточно.
AiK
На сайте с 27.10.2000
Offline
257
AiK
#5

Вот уж нет. Я про люди, годы, гады у Яндекса спрашивал? Нет! У Рамблера про человеков скольки-то лет спрашивал? Тоже нет!

Возможно, эти документы и релевантны, но только не первоначальному запросу.

И если меня не удовлетворят результаты по запросу человек года, то я в состоянии без посторонней помощи задать вопрос в виде "люди лета" и т.д., правда я подозреваю, что мне начнут материалы про времена года подсовывать.

А вот для того, чтобы получить ответ на поставленный вопрос, мне придётся вспоминать, что для этого в Яндексе, я должен записать свой вопрос в виде !человек !года.

А в рамблере как этого добится я не знаю, да и не хочу этого знать - быстрее к конкурентам обратиться.

K
На сайте с 27.11.2000
Offline
80
#6

Originally posted by AiK:
А в рамблере как этого добится я не знаю, да и не хочу этого знать - быстрее к конкурентам обратиться.

Ключевое словосочетание здесь - "не знаю, да и не хочу этого знать"

А делается это в Рамблере ну просто самым очевидным и интуитивным образом, который вдобавок подробно описан - просто надо заключить в кавычки или слово, или всю фразу для поиска на точное ее вхождение.

Попробуйте на досуге На всякий случай подсказываю - запрос "человек года"

С уважением, Андрей Коваленко aka Keva
AiK
На сайте с 27.10.2000
Offline
257
AiK
#7

А как насчёт ЕЯ?

K
На сайте с 27.11.2000
Offline
80
#8

А насчет ЕЯ - так тут в принципе все плохо :-) Есть в настоящий момент только одна искалка, которая действительно неплохо обрабатывает запросы на естественном языке - это в свое время разработанный в МедиаЛингве "Следопыт" или, как мы его называли тогда, "Следопут" Скорее всего, trial version и сейчас можно взять на сайте МЛ.

Суть применявшегося там метода состояла в построении так называемой "оптимальной булевой формы". Вычисление запроса на самом деле порождало предварительный шквал одно- и двусловных запросов, по которым производилось взвешивание термов, после чего из всех этих термов уже и строился окончательный поисковый запрос.

Очевидно, что ни одна из больших поисковых машин не может себе такого позволить - просто железа не хватит. Увы

А простое игнорирование так называемых "стоп-слов" никоим образом не приближает нас к истинно нечеткому поиску.

Наверное, самым лучшим приближением из относительно простых является построение запроса из всех поданных слов, объединяемого оператором "ИЛИ", с "правильным" ранжированием.

A
На сайте с 23.11.2000
Offline
166
#9

Классные результаты! Правда, этот факт как нельзя лучше подверждает мнение Артема - чем меньше баловства с морфологией, тем лучше. :0) То, что цитату интуитивно надо брать в кавычки, Андрей точно заметил, но статистика тут не в его пользу, 95-ти процентам посетителей и кавычить лень, и хелпов они тоже не читают.

Мы удовлетворены, когда результаты усилий совпадают с нашими ожиданиями. Тестирование поисковых систем можно попытаться вести и по этому принципу соответствие-несоответствие ожидаемому. Но тут придется выделить несколько типов ожиданий пользователей в поисковиках и соответствующие каждому типу проблемы.

С одной стороны, поиск - это поиск цитат. "Человек года" - идиома, и результаты поиска с учетом морфологии - "люди, годы, гады" - кажутся смешными. Поисковики пока еще не обзавелись автопроверкой на "устойчивость выражения", чтобы ставить кавычки там, где этого не сделал пользователь.

С другой, поиск страниц, наиболее точно соответствующих некоей теме, характеризующейся избранной пользователем группой слов. "Обзор экспорт импорт и производство глицерин в странах СНГ". Пользователь не знает, как формулировать запрос, и пишет слова, которые, по его мнению, должны быть в необходимом тексте. Тут без морфоразбора обойтись трудно, цитата "производство глицерин в странах" возможна только по недосмотру корректора. А дальше, как повезет - правильный ли набор указал пользователь, в нужном ли порядке расставил слова, есть ли такая информация и т.п.

Третий тип - когда пользователь задает прямой вопрос: "почему не коннектится ася", "почему у меня не открываются трояны", "зачем некоторые насекомые выделяют пахучие вещества" и т.п. Здесь больше всего разочарований - "как же так, ведь я же очень даже понятно спросил..." :0)

И четвертый - однословные запросы. Вопрос, что должна выдавать ПС в ответ на запрос "работа", "музыка", "программы" и т.п. пока теоретический и очень спорный. Статистической работы на тему, каковы ожидания пользвателей, вводящих такие запросы (их примерно половина от общего числа), еще не видел.

2ewspam: "Бесконечного" количества разных запросов как раз не бывает. Как только определено, что необходимо искать, круг возможных формулировок, которые реально используются посетителями, очень невелик. И, по моим наблюдениям, все они распределяются между перечисленными типами (есть, правда, еще и тип запросов "в шутку", тоже довольно много). :0) Интересно было бы провести сравнение ПС, анализируя одновременно, какие типы запросов и при каких задачах используются.

M
На сайте с 25.01.2001
Offline
57
#10

Originally posted by AiK:
... Берём очень простой запрос человек года

Яндекс:

Видимо, какая-то машинка не ответила. http://www.yandex.ru/yandsearch?text=%F7%E5%EB%EE%E2%E5%EA+%E3%EE%E4%E0 - на первом месте bestperson, как и должно быть.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий