Организация поиска по сайту

M

133

medaest

10 марта 2006, 02:18

2741

Надо организовать поиск по документам на сайте, нужны рекомендации по существующим поисковым системам.

Документы хранятся в БД пока мускул, в дальнейшем Oracle.

Особенности:

1. Малый объём документа (до 1К).

2. Большое количество документов (очень много, около 400К).

3. Быстрый прирост базы документов (от 300 в сутки).

4. Русский язык и морфология.

Желательно системы с умеренной стоимостью, т.к. прямого дохода от проекта не будет.

Тип проекта: агрегатор

Спасибо.

L

35

Leom

10 марта 2006, 06:57

#1

www.searchinform.com

Engine на 1 сервер вписывается в допустимые пределы. Единственно нужна винда. А по кол-ву документов без проблем держит и 100 млн

Leo www.searchinform.ru (www.searchinform.ru)

404

Segey

10 марта 2006, 07:11

#2

http://www.cn-software.com/cnsearch/

не пробовал, но вроде бы неплохо

Brexit - уже совсем рядом. (https://about-this-model.blogspot.com/2019/03/brexit.html)

M

133

medaest

10 марта 2006, 07:29

#3

Leom, пока нужна версия под FreeBSD

Segey, возьму на заметку, спасибо. Плохо что без доступа к БД

Z

32

Zute

10 марта 2006, 11:56

#4

http://www.mnogosearch.org/

http://www.dataparksearch.org/

Оба умею индексировать прямо из БД, оба GPL. dataparksearch есть в портах FreeBSD www/dpsearch

Если действительно хотите впоследствии юзать Оракл, то тогда пробуйте mnogosearch.

M

133

medaest

10 марта 2006, 12:42

#5

Zute:
Оба умеют индексировать прямо из БД, оба GPL.

Предел мечтаний, поюзаю.

I

64

itman

11 марта 2006, 12:26

#6

Кстати, по поводу dataparksearch. Сейчас его юзаю. В мягких выражениях: вещь довольно глючная (по мелочи, к счастью). Потом как-нибудь список глюков создателю отправлю, но если Вы не умеете держать в руках дебагер с компилятором и сорснавигатором, то можно и не справиться с установкой :-) Возможно, что максимум глюков приходится как раз на кешемоду и группировкой по сайтам.

Особенно меня поразил тот факт, что урл вида https://searchengines.guru/ (без слеша на конце), считается датапарксёрчем ошибочным. Это, собственное, не мешает ему его проиндексировать. Тем не менее группировка с другими страницами того же сайта не происходит.

Правда, надо отдать должное в кешемоде ищет довольно-таки быстро.

Приходите завтра, завтра будет! (http://itman666.livejournal.com)

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

171

filosof

11 марта 2006, 13:10

#7

http://w3search.info/ - бесплатная авторская

Z

32

Zute

11 марта 2006, 13:12

#8

itman:
Кстати, по поводу dataparksearch. Сейчас его юзаю. В мягких выражениях: вещь довольно глючная (по мелочи, к счастью). Потом как-нибудь список глюков создателю отправлю, но если Вы не умеете держать в руках дебагер с компилятором и сорснавигатором, то можно и не справиться с установкой :-) Возможно, что максимум глюков приходится как раз на кешемоду и группировкой по сайтам.

Хм, а вы его на какой операционке юзаете ? У меня на FreeBSD, работает стабильно. Хотя может к чему уже и привык, как к тому же слэшу в конце урла :) Ну а список глюков отправить разработчику - чуть ли не единственный способ от них избавиться в следующих версиях :d

Яндекс кобласит Вопрос по js, как Как в моем случае

I

64

itman

11 марта 2006, 13:30

#9

Под Линуксом, но это, похоже, не важно.

Короче, Вы правы асболютли, просто у меня пока руки не дошли. Но большинство багов с операционкой явно не связаны :-) Так, например, датапарк не работает с mysql v 4. А потому што в mysql 4 нет еще пока ключевого слова OFFSET. Фигня, конечно, компйлер и исходник всегда под рукой :-)

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

Z

32

Zute

11 марта 2006, 13:43

#10

itman:
Так, например, датапарк не работает с mysql v 4. А потому што в mysql 4 нет еще пока ключевого слова OFFSET. Фигня, конечно, компйлер и исходник всегда под рукой :-)

OFFSET есть начиная с версии 4.0.6

http://dev.mysql.com/doc/refman/4.1/en/news-4-0-6.html

Что такое Power BI и зачем это нужно бизнесу

Яндекс Вебмастер вынес товарные фиды в отдельный раздел