Поисковые движки

B
На сайте с 02.09.2002
Offline
42
bvd
#51
Как писал iseg


Как и
обещал, привожу верхушки списков ассоциациативных групп.

Илья, не могли бы Вы пояснить (напомнить ?), что означают Ваши записи

на примерах:

"15 потерянных групп " -- "области !~ областью-область-областей

песни !~ песнях-*-песня-*-песен"

"15 добавленных групп " -- "завод =~ заводям-заводь-заводные-заводная

"

Спасибо.

I
На сайте с 15.12.2000
Offline
80
#52
Как писал bvd
Илья, не могли бы пояснить

С удовольствием.

Это значит, что алгоритм, (скажем stemka в глубоком варианте отсечения), считает что формы "завод" и "заводь" являются морфологическим вариантами (формами одного слова/основы или что-то в этом роде), а "области" и "областью" - нет.

При этом, если судить по в(полу)ручную размеченному и проверенному глазами корпусу, "завод" и "заводь" не являются парой морфологических вариантов, тогда как "области" и "областью", напротив, являются.

"Добавленные" и "потерянные" пары и есть промежуточный (хотя и не безынтересный) результат, который затем "прозванивался" на качество при помощи Гугля.

dema501
На сайте с 03.03.2003
Offline
64
#53

Извините за вторжение

Не могли бы Вы прокомментировать Lucene

http://jakarta.apache.org/lucene/docs/index.html

с точки зрения качества поиска

Как вариант решения проблемы поиска для малых сайтов...

P
На сайте с 07.01.2004
Offline
3
#54

Судя по топику (особенно вначале) большинство современных поисковых систем используют коды он Keva (он сам об этом говорит). Действительно ли это оптимальный код? Разумеется, вопрос не к разработчику. Тем не менее, я вовсе не против такого положения. Возможно, Андрею нужна помощь? Почему бы не объединить все усилия в один проект. Ведь ясно, что лет через несколько из всех поисковых технологий будет выбрано всего несколько. Авторов назовут отцами компьютерной морфологии (это уже, практически, негласно сделано). А зачем эта конкуренция? Вопрос, конечно больше философский:-)

Тем не менее, хочу задать вопрос прямо Keva. Какие у вас планы? Чем в данный момент занимаетесь? Нужна ли помощь, и какая?

С уважением, Павел.

K
На сайте с 27.11.2000
Offline
80
#55
Как писал Pavelkq
...Почему бы не объединить все усилия в один проект. Ведь ясно, что лет через несколько из всех поисковых технологий будет выбрано всего несколько. Авторов назовут отцами компьютерной морфологии (это уже, практически, негласно сделано). А зачем эта конкуренция? Вопрос, конечно больше философский:-)

Тем не менее, хочу задать вопрос прямо Keva. Какие у вас планы? Чем в данный момент занимаетесь? Нужна ли помощь, и какая?

Во-первых, хочу сказать большое спасибо за комплимент :)

Давайте разберемся, о какой морфологии идет речь.

Если речь идет о словарном морфологическом анализаторе, то я над ним практически сейчас не работаю. Так, иногда внесу какие-то слова, но редко. И потюниваю его периодически в плане производительности. Однако это - коммерческий продукт, который продается и является моей собственностью. В силу сказанного, я вовсе не нуждаюсь в чьем-либо участии в этом проекте, так как у меня нет желания ни с кем делиться деньгами от его продажи :) Цинично, но это так :) И если выбирать между лаврами отца-основателя и наличными, я выбираю однозначно второе :)

Если же речь идет об открытых проектах, распространяемых бесплатно, как, например, stemka - тут я готов принять любую посильную помощь, слить этот проект с любым другим, до тех пор, пока результат будет распространяться бесплатно.

З увагою :), Keva.

С уважением, Андрей Коваленко aka Keva

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий