В ТЗ заказчик просит морфологический поиск.

12
T
На сайте с 08.04.2004
Offline
97
3663

У меня есть достаточно солидный (но бедный, т.к. государственный) заказчик, у которого в ТЗ к разрабатываемого сайта есть такая фраза:

Должен быть реализован поисковый модуль: индексирование и поиск информации на сайте с учетом русской и английской морфологии.

Сайт будет строиться на самописной CMSке. Поиск то у нас есть по точному совпадению. Но вот с морфологией я связываться не хочу.

Вариант поставить Гуглю или ЯндексXml не подходят, т.к. есть закрытые разделы сайта, куда роботов не пускают.

Разрабатывать самостоятельно я поисковик не хочу и не могу, тем более бюджета на это нет.

Вопрос: Что бы поиспользовать в таком случае?

Вообще, я бы и купил бы такой модуль для своей CMSки.

куплю СДЛ от 300 поисковых уников. не порно, по законам РФ. (/ru/forum/274655)
_mihey
На сайте с 15.07.2005
Offline
199
#1
Tritel:
Вопрос: Что бы поиспользовать в таком случае?
Вообще, я бы и купил бы такой модуль для своей CMSки.

Батенька, покупайте Яндекс

Куплю размещение статей с трансляцией в Я.Новости (/ru/forum/833079)
T
На сайте с 08.04.2004
Offline
97
#2

Спасибо, блин. А еще можно Гуглю купить ;)

_mihey
На сайте с 15.07.2005
Offline
199
#3
Tritel:
Спасибо, блин. А еще можно Гуглю купить ;)

У гугли нет русской морфологии.

А по теме - я серьезно. Да, больше сказать нечего. Разработка поисковика с морфологией - это не неделя по времени и не одна тысяча долларов по затратам. И словарь словоформ денег стоит немалых.

Попробуйте с Яндекс-xml намутить что-нибудь в поиске по сайту.

T
На сайте с 08.04.2004
Offline
97
#4

Ха. Нашел:

http://company.yandex.ru/technology/products/Yandex-Server/features.xml

Вопрос: Можно ли его заставить искать в Мускуле, а не только страницы парсить?

Правка2: ЯндексСервер не годится. Хочет РУТового пароля от сервера. Хрен ему.

Зато нашли вот такую прелесть.

http://www.ibm.com/developerworks/ru/library/os-php-sphinxsearch/index.html?S_TACT=105AGX99&S_CMP=GR01

Alex88
На сайте с 24.10.2007
Offline
29
#5
_mihey:
У гугли нет русской морфологии.

Да ну? И как давно? Блин, каких только сказок тут не услышишь.

_mihey:

А по теме - я серьезно. Да, больше сказать нечего. Разработка поисковика с морфологией - это не неделя по времени и не одна тысяча долларов по затратам. И словарь словоформ денег стоит немалых.
Попробуйте с Яндекс-xml намутить что-нибудь в поиске по сайту.

Есть какой-то мужик, увы, сайт потерял. Он продает систему поиска баксов за 80 с учетом морфологии. Есть реализации на перле и пхп. Вернее сказать, там идет разбор слова по словарю и с алгоритмами, довольно, кстати, правильный. То есть выдаются все словоформы. Ну а искать словоформы любой мускуль может.

ТС, поищите, я его находил в Яше. Была даже крякнутая версия. Потестил - понравилось. Своих денег стоит. Собственно, там сам модуль можно скачать просто так, а вот словарь за бабки.

И меня на ты - фидошная привычка. Взял за правило: с людьми в шапке модератора в дискуссии не вступать. Сильный завсегда победит слабого.
E
На сайте с 14.09.2007
Offline
24
#6
Tritel:

Разрабатывать самостоятельно я поисковик не хочу и не могу, тем более бюджета на это нет.

Вопрос: Что бы поиспользовать в таком случае?
Вообще, я бы и купил бы такой модуль для своей CMSки.

Посмотрите:

http://sphinxsearch.com/

http://mnogosearch.org/

Есть морфология, opensource. А вообще, впору уже в FAQ выносить :) Раз в два-три дня возникают подобные вопросы. Гляньте, я тут приводил список бесплатных движков:

/ru/forum/comment/2571038

Moonrainbow
На сайте с 08.01.2007
Offline
144
#7
Tritel:

Вариант поставить Гуглю или ЯндексXml не подходят, т.к. есть закрытые разделы сайта, куда роботов не пускают.

Я бы сказал, что Гуглу начхать на

закрытые разделы сайта, куда роботов не пускают.

На этом форуме его ботов тоже к много чему не подпускают...а им начхать 😆

...давным давно, когда ссылки здесь были цветными... Google . ru - This service is not available from Crimea. If you believe the country of origin was incorrectly identified, please report it at ...
T
На сайте с 08.04.2004
Offline
97
#8
Я бы сказал, что Гуглу начхать на

Поверьте мне, я умею сделать так, чтоб Гугля туда не мог зайти. И вообще, чтоб никто не мог, иногда даже я сам :)

T
На сайте с 08.04.2004
Offline
97
#9

Essay, спасибо. http://sphinxsearch.com/ - То что нужно.

Вот еще статья про Сфинкс http://www.ibm.com/developerworks/ru/library/os-php-sphinxsearch/index.html?S_TACT=105AGX99&S_CMP=GR01

А вот доклад Андрея Аксенова (автора Сфинкса) http://rutube.ru/tracks/197391/comments.html

Может пригодится кому...

T
На сайте с 23.10.2005
Offline
60
#10
Alex88:
а вот словарь за бабки.

Видел в сводном скачивании словарь Зелезняка. К стати, может и он уже лицензии стоит?

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий