Яндекс и Рамблер - пёртый поиск.

12
AiK
На сайте с 27.10.2000
Offline
257
AiK
3127

Очередной морфологический ляп.

Решил узнать что такое диаграммы Перта.

Узнал много нового :)

при<-пру<-переть<-перт<-Перта что в Яндексе, что в Рамблере.

Причём Яндекс выдаёт один и тот же документ на разных серверах.

Рамблер знает ещё один документ. Но как получить его и тот документ, что знает Яндекс одним запросом мне не известно.

Апорт вообще таких словей не знает

И только Гугль выдаёт все три документа при естественном запросе (pdf и rtf не учитываю)

Риторический вопрос - каким поисковиком я воспользуюсь в следующий раз? :)

Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#1

Яндексом и Рамблером. В надежде найти еще один ляп...

F
На сайте с 15.11.2000
Offline
116
#2
Как писал AiK
Риторический вопрос - каким поисковиком я воспользуюсь в следующий раз? :)

Во-первых, если задать вопрос немного по-другому, то в Яндексе находится еще один документ кроме тех, что были указаны ранее:

http://www.yandex.ru/yandsearch?text=%E3%F0%E0%F4%E8%EA+%21%CF%E5%F0%F2%E0

Во-вторых, проверять размер базы по одному запросу просто некорректно. У Яндекса по рунету база больше гуглевой, больше рамблеровой, и все равно у меня были случаи, когда нужный документ находился только в Рамблере, и даже только в Turtle.

С уважением,

Александр Садовский.

AiK
На сайте с 27.10.2000
Offline
257
AiK
#3
Во-первых

не угадал :) вторым был запрос к Гуглю, потому что скопировать запрос из одного бара в другой быстрее, чем придумать "правильный" запрос.

(Кстати, Яндекс и тут нахимичил - Ctrl+V не работает :()

Я даже обратил внимание на то, что искомые документы имелись и в выдаче Яндекса только когда этот топик создавал. Третьим был бы запрос

Pert's diagrams, однако первый же документ в Гугле содержал ответ на мой вопрос (в заголовке был упомянут Microsoft Project), и я прекратил поиски.

Во-вторых,

Честное слово, я хотел ввернуть красивый термин "полнота", но удержался. Не нравится в данном случае другое - Яндекс с Рамблером считают меня за идиота не способного задать вопрос в нужном падаже и подпихивают какую-то ахинею. Ладно бы ещё предпочтение точной словоформе бы отдавали, так они считают что лучше меня знают, что я ищу на самом деле. Намой взгляд Аопрт даёт более удовлетворительный результат, нежели Яндекс с Рамблером.

Наверное, моё недовольство вызвано в основном тем, что я к поисковику отношусь как к энциклопедии, которая предполагает поиск без морфологических изысков.

З.Ы: возвращаясь к тематике форума:

такие "доплеровские эффекты" можно попробовать применить при продвежении ресурсов. Например, для того, чтобы продвигаться по запросам "Три медведя" или "Три богатыря" писать в тексте

"Тереть медведя" и "тереть богатыря" :):):)

AiK
На сайте с 27.10.2000
Offline
257
AiK
#4

Да, самое интересное забыл!

Во-первых, интересно узнать в каком словаре можно найти причастие

(отглагольное прилагательное?) пёртый, из которого оба поисковика получили краткое прилагательное пёрт?

И, во-вторых, помнится Илья очень сильно обиделся, когда я сделал предположение, что Рамблер и Яндекс используют одни и те же технологии. Ну не бывает в двух разных программах одинаковых ошибок :)

Апорт хоть по-честному на запрос "трутся медведи" числительное "три" не выделяет как искомое (хотя про пиво и мороженое три медведя документы тоже возвращает). А рамблер с яндексом почему-то уверены, что терется и три это синонимы.

Хотелось бы взглянуть в честные глаза того "морфиста" :), который такой интересный словарик составил :).

Ashmanov
На сайте с 21.11.2000
Offline
66
#5

Я вам, коллега, как бактериолог офтальмологу, дам справку. В его честные глаза взглянуть вряд ли удастся. Это А.А.Зализняк, величайший русский лингвист современности.

Но он вряд ли будет встречаться с развязным оптимизатором, давно поражённым интернет-зависимостью в n-й стадии, чтобы показать тому свои глаза. Ты ж таки не офтальмолог. Он занят наукой, я думаю.

По поводу похожести ошибки - все существующие русские морфологии основаны на "Грамматическом словаре" Зализняка. А если нет, то о них и говорить не стоит.

А в словаре Зализняка дана определённая свобода в образовании кратких форм прилагательных, как и в отношении повелительных наклонений глаголов и т.п. Очевидно, чтобы показать грамматическую возможность их образования. Этот великолепный словарь не был предназначен для компьютерного использования.

Для того, чтобы сделать проверку правописания или поисковую морфологию, работающие с реальными текстами, приходится буквально на глаз, вручную вычищать такие вещи - усекать парадигму. Это тысячи случаев.

В отношении причастия "пёртый", очевидно, руки не дошли ни у Сегаловича, ни у Коваленки, или им показалось, что у него есть шанс встретиться в реальной жизни. Замечу, что и у меня тоже не дошли - ОРФО в Ворде тоже его не подсвечивает, как неправильное. Да там таких случаев ещё полно, стоит только слегка поискать. Просто в запросах и текстах не попадаются.

Вот хороший пример: в яндексной морфологии разрешена краткая форма "апельсинова" от прилагательного "апельсиновый". А она вообще бывает? да вроде нет.

Или вот "абрикосово" - бывает это в русском тексте? А хрен его знает, ваше высокоблагородие.

В ОРФО мне пришлось эти формы вычистить, иначе пропускались бы опечатки - возможные нечаянные потери букв -я, -й на конце соответствующего прилагательного. Чистил в 1990 г. путём просмотра и принятия решений на месте.

А поисковику это не так важно - или сил нет прочитать словарь целиком.

Правда, в Рамблере, то есть у Коваленки, их тоже нет - потому что его морфология пришла из проверки правописания, из Прописи, то есть более чистая. У него "апельсинова" трактуется только как фамилия, а "абрикосово" - как село или как часть абрикосово-черничного торта. Или как украинська лексэма. Вот там найдётся всё. Яка чудова українська мова! Де береться всё це, звідкіля і як?

А отключить морфологию в Рамблере или Яндексе не пробовал? Это ведь можно легко сделать.

С уважением, Игорь Ашманов Все для оптимизации (рассылка, сервисы): www.optimization.ru (www.optimization.ru) Сервис по созданию собственных поисковиков: www.flexum.ru (www.flexum.ru)
spark
На сайте с 24.01.2001
Offline
130
#6
Яка чудова українська мова! Де береться всё це, звідкіля і як?

наприклад звідси http://www.proling.com/ поюзайте тезаурус, кому интересно

А если нет, то о них и говорить не стоит.

иногда стоит :)

Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#7
Или вот "абрикосово" - бывает это в русском тексте? А хрен его знает, ваше высокоблагородие.

Вообще-то, по большому счету, это все фиолетово :).

"Абрикосово-яблочный сок", к примеру. С трудом представляю себе вкус такого напитка, но с точки зрения грамматики (нашей русск грмтк) вроде все правильно.

руки не дошли ни у Сегаловича, ни у Коваленки, или им показалось, что у него есть шанс встретиться в реальной жизни.

Я думаю, тут срабатывает логика работы над проектами - как-то, году в 94-м, я читал материал о ходе тестирования компьютерной игры, в котором отмечалось, что есть ошибки, которые известны разработчикам, но которые не будут устраняться - ибо эффект от их устранения не сравним с количеством усилий. В качестве примера там приводилась такая ошибка - в симуляторе войны на Тихом океане Pasific Strike в определенной миссии, при подлете к кораблям, солнце вставало не с той стороны. Ошибка хорошая, но много ли юзеров ее заметят? Играть она не мешает, так какой смысл перерисовывать кучу графики из-за этого?

При выпуске продукта всегда находится компромисс между количеством оставшихся ошибок и усилий, необходимых для их исправления.

Ты ж таки не офтальмолог.

Все мы немного офтальмологи, с нашим-то стажем ношения очков :).

AiK
На сайте с 27.10.2000
Offline
257
AiK
#8
Я вам, коллега, как бактериолог офтальмологу, дам справку. В его честные глаза взглянуть вряд ли удастся. Это А.А.Зализняк, величайший русский лингвист современности.

Спасибо, Игорь. Страна должна знать своих героев. Теперь я знаю кто виноват :). Это я и имел ввиду под фразой "взлнянуть в честные глаза".

Но он вряд ли будет встречаться с развязным оптимизатором, давно поражённым интернет-зависимостью в n-й стадии

На счёт развязности Вы пожалуй правы, про зависимость Вам наверное виднее, а вот с термином "оптимизатор" в данном контексте категорически не соглашусь - я писал как пользователь. Как оптимизатор я только рад таким ошибкам - если хорошо подумать, то возможно из этого можно и пользу кое-какую извлечь. Надо только поиск таких фич поставить на промышленной основе :)

Этот великолепный словарь не был предназначен для компьютерного использования.

Ну с этого и начинать надо было. Значит виноват не Зализняк, а тот кто первый стал использовать этот словарь не по назначению :).

А отключить морфологию в Рамблере или Яндексе не пробовал?

Идея хорошая, но не практичная - ещё поискать надо где её отключить можно. Гораздо проще при необходимости отключения морфологии для какого-то конкретного запроса воспользоваться поиском Гугля.

А теперь я попрошу ещё одну справку: не могли бы Вы провести краткий ликбез, как работает, например Рамблер с этим замечательным словарём?

То, что словарь запросто даёт переход от почитать к почти, а от почти к почта через почту, возможно это и есть хорошо. А вот то, что поисковик даёт переход от почитать к почта - это плохо. Адназначна! Неужели проблематично выбросить автоматом те переходы, которые осуществляются через совсем другие части речи? Т.е. в цепочке

почти-почту-почта выкинуть последний элемент, как заведомо неверный?

Просто на том основании, что почта имеется в словаре как самостоятельная, а не производная единица? В Апорте похоже именно так и поступили.

Спасибо за уделённое время.

S
На сайте с 03.05.2002
Offline
25
#9

А можно конкретный пример, когда Яндекс находит "почта" на запрос "почитать"? Просмотрел 20 страниц, есть только "почти" и "почту", но формально в этом случае он прав. Можно говорить о том, что этим формам можно было бы уменьшать рейтинг, но это уже другой вопрос.

AiK
На сайте с 27.10.2000
Offline
257
AiK
#10
но формально в этом случае он прав

М-да, писал по памяти, поэтому "почта" приплёл зря :(

Но сравните результаты выдачи Апорта и Рамблера по запросу "почитать".

Никакой почтой там и не пахнет :)

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий