Организация поиска по сайту (группе сайтов)

12
PL
На сайте с 04.10.2003
Offline
75
2332

Требуется организовать по сайту (группе сайтов) поиск, причем очень важно - это должен быть качественный поиск на русском языке. Если я знаю что среди кучи страниц есть одна такая фраза, а поисковик ее не выдает - это очень плохо.

Вот к примеру такие системы:

Harvest

ASPseek

ht://Dig

Какая из этих систем лучшим образом с такой задачей справится и почему именно она?

Z
На сайте с 03.01.2004
Offline
32
#1

aspseek - писан русскими, имхо, должен лучше всех из перечисленых справляться с русским. Можете еще посомтреть http://www.dataparksearch.org/ и http://www.mnogosearch.org/ - тоже писаны русскими и неплохо работающие с русским.

PL
На сайте с 04.10.2003
Offline
75
#2
Zute:
aspseek - писан русскими, имхо, должен лучше всех из перечисленых справляться с русским. Можете еще посомтреть http://www.dataparksearch.org/ и http://www.mnogosearch.org/ - тоже писаны русскими и неплохо работающие с русским.

Ну, да aspseek использует теже библиотеки (словари), что и mnogosearch...

А все же как там с качеством поиска?

Насколько я помню, в mnogosearch не все гладко - при определенных параметрах поиска, точных вхождений не получается хотя они в тексте присутствуют.

Меня вот заинтересовал Harvest - с ним кто-нибудь работал?

Я не знаю как там с поддержкой русского языка, но весьма заманчиво то, что систему можно размещать на разных машинах, а результат индексации можно объединять в единую выдачу.

Z
На сайте с 03.01.2004
Offline
32
#3

Глюки с фразами у mnogosearch точно не от словарей/библиотек зависят, имхо :)

так что пробуйте aspseek, может понравится, хотя он давно не развивается.

У mnogosearch и dataparksearch тоже можно объединять результаты с разных машин.

K
На сайте с 27.11.2000
Offline
80
#4
POLL:
Требуется организовать по сайту (группе сайтов) поиск, причем очень важно - это должен быть качественный поиск на русском языке. Если я знаю что среди кучи страниц есть одна такая фраза, а поисковик ее не выдает - это очень плохо.

Какая из этих систем лучшим образом с такой задачей справится

www.sitemeta.com

POLL:
и почему именно она?

попробуй...

С уважением, Андрей Коваленко aka Keva
Z
На сайте с 03.01.2004
Offline
32
#5
Keva:
www.sitemeta.com
попробуй...

Хм, оно ж под Windows, - немного не та опера со всем вышеперечисленным...

aspnet
На сайте с 17.09.2005
Offline
68
#6

Яндекс недавно обновил предложения по своим продуктам

Вот это в плане построения индекса типа крауления по сайту - идеальный вариант и, думаю, что лучше вы врятли найдете.

Яndex.Server Standard+ $790

Есть другие моменты .... с точки зрения поиска в БД - но это отдельная песня

Z
На сайте с 03.01.2004
Offline
32
#7

Отдельная песня и индексирование чего-либо отличного от TEXT и HTML...

aspnet
На сайте с 17.09.2005
Offline
68
#8
Отдельная песня и индексирование чего-либо отличного от TEXT и HTML...

в поставленной задаче фигурировали критерии качественного поиска. С точки зрения этого критерия, думаю, врятли можно предложить что-то лучшее, хотя бы потому, что сам Яндекс занимает очень большую долю в поиске по русско язычным ресурсам.

А если вы захотите индексирование всего остального - то все упирается в деньги. Купите другую версию или я !если не ошибаюсь! слышал что к Я.Серверу можно докупать модули по типам .... саппорт яндекса наверно расскажет подробнее ;-)

S
На сайте с 14.11.2005
Offline
47
#9

а dataparksearch отлично и по экселевским и по вордовским и по пдф-кам ищет - только что удалось настроить. Насчет качества поиска - то очень много зависитъ от настроек.

K
На сайте с 27.11.2000
Offline
80
#10
Zute:
Хм, оно ж под Windows, - немного не та опера со всем вышеперечисленным...

Да-а-а? :) И давно? Вообще-то это полноценная кроссплатформенная штука. Win32, FreeBSD, Линух. А с минимально приложенными усилиями - и солярка на спарке.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий