Вот эта штучка лажу гонит, даже для англоалфавитных запросов...
Метапоисковик nigma.ru показывает в результатах позицию найденого урла в каждом из поисковиков, поизиции msn видея, яху нет, по идее должен всех поисковиков показывать, если есть :)
А общего у них только вспомогательные функции, тоже как ни крути, и производительность и функциональные возможности тоже разные, про это и была речь, именно в этом вы были некорректны, про общность происхождения вопрос не поднимался...
Только модуль mimetype для "Индексирование документов в форматах отличных от plain text и HTML: XML, RTF, PDF, DOC, XLS, PPT, FLASH, MP3 с возможностью расширения этого списка" стоит $2990 и это прикручивается только к Яndex.Server Professional - недорогой не получается...
Как не крути, эт всёравно больше, чем просто вытаскивать :p
У того, у кого винт шустрее писать будет :)
Вы забыли одну маленькую детальку: у DataparkSearch при этом ещё идёт индексирование, а у вас только выкачивание. Ну и естественно, при достаточно широком канале всё уприрается в скорость записи на винт.
Ну и если сравнивать dpsearch 4.22 и 4.31 (последнюю версию), то последняя по скорости раза в два быстрее (наглазок).
В портах freebsd есть:
www/dpsearch
www/mnogosearch
www/mnogosearch31
www/swich+
www/swish-e
www/udmsearch
Попробуй, что понравится. Я использую dpsearch, это ответвление от mnogosearch. Обоим чтобы индексировать doc, rtf, chm нужны внешние парсеры - утилиты переводящие файлы этого формата в html или plain text.
mnogosearch31 - предыдущая версия mnogosearch, работает пошустрее, но меньше возможностей и не поддерживается более. udmsearch - ещё более древняя версия mnogosearch. swish+ не пробовал, swich-e юзал очень давно.
Хм, с одной стороны сайт, с другой - поисковик для сайта, ранее там стоявший, теперь там стоит dataparksearch...
А вы как продолжали делать выводы непойми на какой давности инфе, так и продолжаете.... Зачем только вводить людей в заблуждение, вы лично смотрели и сравнивали mnogosearch и dataparksearch и как давно ? Хотя если б смотрели и сравнивали, вопросов про исходники бы не было 🚬
Не верно: http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=06&topic_id=1097670258&page=2