ht://Dig vs. AspSeek vs. mnogoSearch

L
На сайте с 02.05.2004
Offline
35
#41
Как писал Zute
Берите: http://www.dataparksearch.org/ - только с .exe боюсь облом будет :), только в исходниках и только под юниксы.

Да это я уже понял и сам -- гуглом пользоваться умею:)

Поэтому и постил предыдущую мессагу -- может кто даст потестить в виде exe и под виндой, а то с Nix у меня нет специалистов. А под виндой мой отдел системного программирования протестит очень конкретно -- и выложит на общее обозрение отчет о тестах.......

Если кто готов дать exe -- пишите в приват

leo собака softinform точка com

Leo www.searchinform.ru (www.searchinform.ru)
ZW
На сайте с 10.08.2004
Offline
7
#42

Исходники же лежат в свободном доступе - так соберите из них поисковик под виндой...

P.S. У нас по нескольким серверам ищет aspseek - вполне им довольны, когда-то пробовали mnogosearch - крайне не понравился, может сейчас лучше стал... Дубляж поиска при помощи старенького Yandex.Site (остался в качестве наследия от былых тестов)...

С уважением, Сибирский Оборотень
V
На сайте с 15.03.2004
Offline
33
#43

Все время обсуждаются скорости и возможности, но ни грама внимания не уделяется качеству самого поиска и выдаче... Что все расматриваемые системы идентичны в этом вопросе???

Z
На сайте с 03.01.2004
Offline
32
#44

Нет ничего более субъективного, чем качество поиска, т.к. нет формального определения релевантности :)

Здесь можно моного копий наломать без особой пользы...

S
На сайте с 14.11.2005
Offline
47
#45
Zute:
Нет ничего более субъективного, чем качество поиска, т.к. нет формального определения релевантности :)
Здесь можно моного копий наломать без особой пользы...

вот интересно - в дпсерч ввели какой-то хитро мудрый алгоритм самонастраивающегося поиска - и еще в дпсерче можно собрать с нитями и он очень быстро стал индексировать - можно указать количество нитей - и все будет зависеть в основном от скорости канала )

С
На сайте с 31.10.2005
Offline
10
#46
Константин:
Я так понимаю тема "заглохла", а жаль... :(
Может получиться у меня оживить... :)
Я сам с Украины, и хорошего отечественного поисковика нет на просторах Уанета, а жаль...
Может ли какой либо движок превзойти по качеству поиска украинскую поисковую систему meta.ua ?
или по другому можно поставить вопрос:
"Возможно ли, на каком либо из упомянутых движков создать поисковую систему которая превзойдет по качеству поиска meta.ua и приблизиться хотябы на чучуточку к гуглу? "

Сомнительно. Разная идеология. Насколько уже разобрался, все эти поисковики - решения для одной машины. Для больших объёмов индексирования нужна масштабируемая архитектура с оптимизацией на стоимость процессорного времени, о чём Брин с Пейджем твердили ещё в 1997 лохматом году. А распределённой и масштабируемой архитектуры у перечисленных проектов как раз-таки и нет.

mnt
На сайте с 11.11.2002
Offline
107
mnt
#47
Странник:
Сомнительно. Разная идеология. Насколько уже разобрался, все эти поисковики - решения для одной машины.

плохо вы разобрались, точнее вообще не разбирались, раз у вас такие мысли ;)

дорого куплю ссылки с хороших жирных русскоязычных авто сайтов.
С
На сайте с 31.10.2005
Offline
10
#48
mnt:
плохо вы разобрались, точнее вообще не разбирались, раз у вас такие мысли ;)

Везде после 1 млн. документов индексированных возникают проблемы. Ни у одного не указана возможность масштабирования в кластер. Пока из масштабируемых нашёл только Harvester (древний Framework), Lucene (в стадии разработки), Nutch (Java, в стадии разработки).

Видел в форуме AspSeek предложение использовать его на нескольких машинах следующим образом: каждый сервер индексирует свою часть интернета, затем на поисковой машине идёт слияние результатов поиска по этим серверам (своеобразный метапоиск). Те, кто пробовали, очень сетовали на итоговую выдачу.

В форуме mnogosearch есть ответ по поводу масштабируемости - очень слабая масштабируемость. В рамках деления поисковика на части.

DataparkSearch тоже можно разделить по серверам на части: отдельно положить MySQL базу, отдельно краулер, отдельно индексатор. Масштабируемость на уровне разрезания. Никакой нормальной масштабируемости у них не нашёл.

Если поправите или дадите ссылочку на масштабируемый поисковик - буду очень рад.

mnt
На сайте с 11.11.2002
Offline
107
mnt
#49
Странник:
Везде после 1 млн. документов индексированных возникают проблемы.

aspseek самый быстрый из перечисленных, если вы разработчик, то нет никаких проблем переделать всё под себя, тем более что исходники aspseek'а очень хороши.

Странник:

Ни у одного не указана возможность масштабирования в кластер.

какая именно масштабируемость вам нужна?

Странник:

Пока из масштабируемых нашёл только Harvester (древний Framework), Lucene (в стадии разработки), Nutch (Java, в стадии разработки).

все java разработки выгледят ооочень убого, nutch помрет ей богу.

Странник:

Видел в форуме AspSeek предложение использовать его на нескольких машинах следующим образом: каждый сервер индексирует свою часть интернета, затем на поисковой машине идёт слияние результатов поиска по этим серверам (своеобразный метапоиск). Те, кто пробовали, очень сетовали на итоговую выдачу.

на самом деле все очень прозрачно, выдача как выдача, баги есть, люди их фиксят, если вам ооочень надо всё можете пофиксить :)

вы слишком многое хотите от халявных разработок.

не найдете, то что вам нужно, если сами не будете "напильником" под себя затачивать. НО и в этом случае конфетку не получите.

Я для своих целей пилил aspseek. вполне доволен.

С
На сайте с 31.10.2005
Offline
10
#50
mnt:
aspseek самый быстрый из перечисленных, если вы разработчик, то нет никаких проблем переделать всё под себя, тем более что исходники aspseek'а очень хороши.

Размер проблем составляет человеко-год доработок для создания распределённого поисковика на основе aspseek. Со слов его создателя.

mnt:
на самом деле все очень прозрачно, выдача как выдача, баги есть, люди их фиксят, если вам ооочень надо всё можете пофиксить :)

Что мне надо, я сам сделаю. Спасибо.

mnt:
вы слишком многое хотите от халявных разработок.
не найдете, то что вам нужно, если сами не будете "напильником" под себя затачивать. НО и в этом случае конфетку не получите.

Причём тут что я хочу? Мы вроде разбирали разницу между метой и опенсоурс поисковиками? И Вы тоже утверждаете, что мету ("конфетку") из них не получить. В чём тогда дискуссия? Зачем личностные наезды про "плохо вы разобрались, точнее вообще не разбирались, раз у вас такие мысли", если итоги размышлений схожи?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий