Глюки яндекса

12
Andrey Ogarok
На сайте с 10.07.2007
Offline
49
#11
upyrj:
Andrey Ogarok, и сколько ресурсов надо на то, чтобы «работать с синтаксисом и семантикой»?

Денис, ресурсы дополнительные нужны, но не так уж много. При правильной организации вычислительного процесса можно реализовать лингвистический анализ на "лету". При этом не надо ломать существующую поисковую систему. Обработка предварительно полученных результатов поиска (для обычных поисков это окончательная выдача) проводится в лингвистическом процессоре, отсеиваются нерелевантные результаты. При этом нерелевантными результатами будут несоответствующие по лингвистическим критериям. А уже после этого пользователю выдаются очищенные результаты. Насчет затрат вычислительных ресурсов можно сказать, что НА ПРАКТИКЕ приходится в полтора раза увеличивать ресурсы. То есть если ранее поисковый кластер состоял из 100 компьютеров, то для полного лингвистического анализа надо еще ~50. Более точно это определяется интенсивностью потока запросов пользователей. Именно так и поступили при создании вопросно-ответной поисковой системы asknet.ru. Она обрабатывает выдачу в том числе и Яндекса, а результаты получаются более качественные. Самое главное без лингвистики далее поисковикам никуда не деться. Еще один аспект в пользу лингвистики заключается в том, что сейчас оптимизаторам достаточно на сайте правильно размещать отдельные слова. Однако полный лингвистический анализ позволяет определить где отдельные слова, а где связный текст. Так что оптимизаторам придется работать техническими писателями.☝

www.asknet.ru (www.asknet.ru) - вопросно-ответная поисковая система. Автоматические ответы на вопросы пользователей.
Andrey Ogarok
На сайте с 10.07.2007
Offline
49
#12
progress:
У меня все адекватно, нет такой картины.



Синтаксис уже давно обработали, а вот семантика - наш язык настолько богат, что не все поддается логике...

Еще раз. Проблема омонимии - это синтаксис. Так что синтаксис "не обработали". Наш язык действительно богат, но он поддается логике. Правдо при формализации логики используется несколько упрощенная модель семантических иерархий. Однако ее достаточно для вопросно-ответного поиска. Посмотрите и убедитесь на примере поисковой системы AskNet.ru. Задавайте вопросы и получайте ответы.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий