Нет, не забыл :) На самом деле этим утверждением вы ответили на мой вопрос о предметности.
Значит, действительно, поисковики приучили продвинутых пользователей искать не информацию, а слова.
То есть вместо того, чтобы спрашивать о "продаже отечественных авто" или "продаже книг о программировании", пользователь вынужден в большинстве систем просить "купить книга программирование С Си С Си++" или "купить автомобиль ВАЗ ГАЗ НИВА"?
В принципе, согласен с вами. Но в целом --- не могу. Если пользователь просит "to be or not to be", то пусть поисковик найдёт либо полное совпадение, либо воспользуется стоп-словарём, если в запросе всё-таки были нагруженные термины. По крайней мере, находить фразы "to was or not to was" (или просто "to be or") мне кажется бессмысленным. Сюда напрашивается база об устойчивых словосочетаниях, куда бы входили и географические названия, и фильмы, и книги, и т.д. и т.п. Но Игорь в другой нитке уже высказывался на эту тему в духе, что держать (и главное, поддерживать) словарь на десятки миллионов словосочетаний пока никто не хочет.
Может быть, действительно нельзя отказываться от сложного поискового языка запросов, если не реализовывать некоторый диалог-настройку поисковой системы под пользователя?
Спасибо всем выступающим! В продолжение темы возник следующий подвопрос по отечественным искалкам.
Проводя поиск в сети, пользователи (в основном) исповедуют технику предметного поиска, то есть составляют запросы, содержащие в основном именные группы. Зачем сетевому поисковику хранить в индексе координаты глаголов, а следовательно разрешать омонимию или гипотезы для незнакомых слов в сторону глаголов (в качестве примера уже упоминавщийся в других нитках запрос "день")? Или я заблуждаюсь насчёт "предметности" типовых поисковых запросов?
iseg:
:) Ну, я имел в виду цитату от AiK в нитке к вопросу об открытии алгоритма яндексации