ht://Dig vs. AspSeek vs. mnogoSearch

Z
На сайте с 03.01.2004
Offline
32
#31

Не сказал бы, что проц здесь главное, более важны толщина канала и крутость дисковой системы.

У DataparkSearch вполне получается около 180Килобайт/с (ну или около 10Мегабайт в минуту :) с 10 нитями на PentiumIV, IDE SATA RAID1, 10Mbit в Нет.

[Удален]
#32
Как писал Zute
Не сказал бы, что проц здесь главное, более важны толщина канала и крутость дисковой системы.
У DataparkSearch вполне получается около 180Килобайт/с (ну или около 10Мегабайт в минуту :) с 10 нитями на PentiumIV, IDE SATA RAID1, 10Mbit в Нет.

Вы меня не так поняли, я не спрашивал про скорость паука, я спрашивал про скорость индексатора. Как правило ему канал в интернет не нужен.

mnt
На сайте с 11.11.2002
Offline
107
mnt
#33
Как писал Maxim Golubev


Вы меня не так поняли, я не спрашивал про скорость паука, я спрашивал про скорость индексатора. Как правило ему канал в интернет не нужен.

с учётом того, что в яндексе идет нормализация слов, а у других перечисленных систем её нет, то можно предположить, что их скорость индексации выше или ниже, в случае использования субд или плохо настроенной субд :)

дорого куплю ссылки с хороших жирных русскоязычных авто сайтов.
L
На сайте с 02.05.2004
Offline
35
#34

Господа проясните насчет возможностей поиска обсудаемых систем.

То что они морфологию не поддерживают -- понятно.

Вопрос -- а как насчет поиска по фращзам с растоянием? Из описаний я пока увидел что они ищут только по набору слов с логической комбинацией and.

Прав ли я?

Leo www.searchinform.ru (www.searchinform.ru)
Z
На сайте с 03.01.2004
Offline
32
#35
Как писал Maxim Golubev


Вы меня не так поняли, я не спрашивал про скорость паука, я спрашивал про скорость индексатора. Как правило ему канал в интернет не нужен.

У DataparkSearch это в одном флаконе, так что вас поняли правильно :)

Z
На сайте с 03.01.2004
Offline
32
#36
Как писал Leom
То что они морфологию не поддерживают -- понятно.
Вопрос -- а как насчет поиска по фращзам с растоянием? Из описаний я пока увидел что они ищут только по набору слов с логической комбинацией and.

Прав ли я?

Совершенно не прав. Морфология поддерживается, поиск по фразам с учётом морфологии тоже. Поиск фраз с учётом расстояния интересует только теоретиков поиска. :)

L
На сайте с 02.05.2004
Offline
35
#37
Как писал Zute


Совершенно не прав. Морфология поддерживается, поиск по фразам с учётом морфологии тоже. Поиск фраз с учётом расстояния интересует только теоретиков поиска. :)

То есть поиск по фразам с расстоянием не поддерживается?

Насчет теоретиков -- не знаю. Все поисковики стараются вначале ввывести те документы где расстояние между словами во фразе минимальное.

А без расстояний будет ну очень много мусора......

Z
На сайте с 03.01.2004
Offline
32
#38
Как писал Leom

Насчет теоретиков -- не знаю. Все поисковики стараются вначале ввывести те документы где расстояние между словами во фразе минимальное.

Искать с учётом расстояний и выводить с учётом расстояний - две большие разницы :)

DataparkSearch выводит с учётом расстояний, но не ищет.

L
На сайте с 02.05.2004
Offline
35
#39
Как писал Zute


Искать с учётом расстояний и выводить с учётом расстояний - две большие разницы :)
DataparkSearch выводит с учётом расстояний, но не ищет.

Крайне любопытно.

Если хранятся позиции слов, для того чтобы ранжировать с учетом расстояний, то сделать возможность искать по расстояниям, это же чисто интефейсная надстройка

А можно ли где-то (например у Вас) полусчить готовые exe этой вещи и дать ей проиндексить например 30 гиг файлов на локале -- чтобы ее уж сильно не затруднять дам только тексты и html и документов там будет под 1 млн.......

Очень интересно будет взглянуть на ранжирование по расстоянию.......

Z
На сайте с 03.01.2004
Offline
32
#40

Берите: http://www.dataparksearch.org/ - только с .exe боюсь облом будет :), только в исходниках и только под юниксы.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий