Поиск с пониманием информации

1 234
M
На сайте с 02.05.2008
Offline
15
#21
RedStar:
Есть еще интересный пример от Сергея Москалева: когда человек ищет "Чайка", что он имеет ввиду - машину, часы, птицу и т.д. (более 10 значений). Т.е. язык, особенно русский, по своей сути, омонимичен.
Есть решение (которое кстати удалось опробовать в другом проекте) - задавать контекст поиска.
Т.е. дорабатываем язык запросов введя новую команду @контекст запроса.

Соответственно имеем запросы:
чайка @машина
чайка @часы
тюрьма @юриспруденция
тюрьма @плохие дяди

Как работает: выбираются ключевые слова, связанные с контекстом, и включаются в основной запрос (скрытно от пользователя) с разделителем OR.
Так для "тюрьма @юриспруденция" найдем страницы, которые не обязательно содержат собственно "юриспруденция", но имеют "место заключения осуждённых". Или для страницы "Чайка едет" поймем что это про машину.

Только вот как объяснить это ребенку? :)

Как Вам такая идея?

А чем плохо сейчас ввести в запрос "машина чайка" или "марка машины - чайка"? Зачем изобретать велосипед, если все-равно строится все на трех основных логических операторах "И" "ИЛИ" "НЕ".

Пользователь поумнел последнее время, сразу вводит то, что ему хотелось бы найти и по какой теме.

Я считаю, было бы удобнее, если приняли единый стандарт запросов с логическими операторами. И не надо было вспоминать где там ставятся ||, а гда надо писать "ИЛИ".

продвижение для ленивых (http://seopult.ru/ref.php?ref=1d37a62cf60667cf )
RS
На сайте с 10.09.2002
Offline
60
#22

Скажите а как SE отличить "он сел в чайку и поехал" и "чайка пролетела мимо"? Там не слов "птица", "машина".

Роман
BrokenBrake
На сайте с 03.03.2007
Offline
194
#23

RedStar, в первом случае кавычки забыли. Но вообще, конечно, сложностей такого плана много. Тот же банальный за́мок и замо́к.

Ufaweb
На сайте с 03.03.2008
Offline
182
#24
RedStar:
Скажите а как SE отличить "он сел в чайку и поехал" и "чайка пролетела мимо"? Там не слов "птица", "машина".

Сейчас поисковики тупо запоминают текст и по запросу пользователя выдают кусок похожего текста. При этом в корне нелогична система "авторитетов" - PR, тИЦ и т.д.

ТС, Вы правы - будущее поиска за контекстом. Немного в эту сторону шагнул Yahoo, выводя варианты запроса при наборе текста.

Кроме того, помочь различать контекст запроса может персонализация поиска - анализ ранних запросов конкретного пользователя, с целью выявить его увлечения, профессию, возраст и прочее.

RS
На сайте с 10.09.2002
Offline
60
#25

Не вижу разницы между чайкой и замком, ударения в вебе отсутствуют.

Как понимаю PR помогают в случаях с накруткой, ТИЦ позволяет еще тему уточнить, но это конечно не контекстный поиск. В любом случае,наличие 500 исключений из правил (или сколько там заявлял Гугл) говорит само за себя.

А варианты поиска уже давно показывает Гугл suggestion.

LucasOFF
На сайте с 18.05.2008
Offline
39
#26

+1 к basilic!

ТС, действительно, надо немного подкорректировать поиск информации, а так в целом это отличная выполненная работа. Желаю вам процветания :)

RS
На сайте с 10.09.2002
Offline
60
#27

Счастливым обладателям джабера - поисковый агент переехал на q@clisearch.net, попутно выучив русский и освоив ряд нужных в быту команд

8
На сайте с 28.07.2008
Offline
3
#28

Советую обратить внимание на START от MIT:

http://start.csail.mit.edu/

Это тоже QA система, открытая ещё в 1998 году (а в сети с 2001). В силу большого кол-ва запросов, заданных системе, её НС уже работает корректно более чем в 70% случаев, причём с уточнением области поиска:

1. Для контента создается краткая аннотация

2. Запрос клиента анализируется на схожесть с аннотацией

3. Наиболее "подходящий" контент возвращается как результат

Хоть она работает на порядок быстрее вашей и имеет on-line интерфейс, но она имеет существенный недостаток... она не на РУССКОМ! Рад, что теперь, хоть и в зачаточном состоянии, появилась (не считая закрытых лабораторий поисковиков) русскоязычная QA система и, возможно, она будет open-source? ;)

з.ы.
почитал ваш сайт, возможно будет интересно (по поводу RSS):
http://feedity.com/

RS
На сайте с 10.09.2002
Offline
60
#29

Привет,

да проекты похожие есть, есть и на русском языке кстати, но только подход немного другой...

Кстати мне кажется или я видел пост по поводу feedity.com на Хабре?

8
На сайте с 28.07.2008
Offline
3
#30

ммм... не знаю, на хабре я не нашёл, а узнал я про этот сайт, т.к. являюсь подписчиком в группах Google их проекта Google-Labs-Sets (http://groups.google.com/group/google-labs-sets/browse_thread/thread/d52ae8f3a72553a2?hl=en), там и был пост про feedity.

Кстати, советую подписаться на RSS вот этого сайта: http://www.hasthelhcdestroyedtheearth.com
Читаю комменты в HTML коде странички: "the first person to ask for an RSS feed gets a free black hole in their junk" :-) :-) :-)

Ладно, кроме шуток, хочу спросить:

1. А русские QA не подскажите? ;-) Желательно, с web-интерфейсом...

2. И ещё вопрос: как вам удаётся парсить Google в своём этом кластеризующем поисковике newisearch? Я имею в виду с точки зрения бана по IP - при привышении кол-ва запросов (условно, 1000 в день). Proxy? Вроде бы нет, работает довольно быстро... Ведь там явно не пользовательский поиск стоит...

1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий