Zute

Рейтинг
32
Регистрация
03.01.2004

Другой вопрос: а зачем расхваливать скорость индексирования, если юзеры поисковика будут видеть только скорость поиска ?

Хм, а на вашем примере так и непонятно, а чем ваше решение лучше простого прикручивания марфологии ?

Не говоря уже о том, что операция AND,которая, как полагаю, подразумевается между словами там, где нет OR, имеет больший приоритет и в вашем булевском выражении не хватает скобок, чтобы оно было более-менее правильным.

Так вас именно распределённая индексация интересует, или распределённый поисковик ? Распределённая индексация поддерживается и mnogosearch и dataparksearch, в смысле можно запустить краулер-индексатор на нескольких машинах и всё будет сливаться в базу на одной машине.

Если вы что-то не дочитали, то это не становится недокуентированным. Перечитайте описание команды DBAddr:


Команда DBAddr является описание хранилища данных в URL-подобном стиле. ... Может быть задано несколько хранилищ данных.

Вот же ж странно, какая тема в технологиях не всплывёт, там itman уже понаотвечал :d

itman:

2) Datapark не позволяет, насколько я знаю, искать распределенно.
3) Mnogosearch позволяет на уровне демона searchd собирать информацию с нескольких машин. Видимо, датапарк несложно докрутить, чтобы он делал примерно тоже самое. Но надо понимать, что при этом никакого распределенного индекса цитирования или учета дубликатов тоже не будет.

Датапарк не надо докручивать, он тоже самое тоже умеет.

Красиво - да, но не более, менее юзабельно, чем обычная выдача, юзеры прежде, чем кликнуть просматривают несколько позиций сразу и целиком, а здесь, чтобы посмотреть описание какой-либо позиции, к ней нужно мышку подтащить.

В приведённом вами топике форума говорится о проблеме создания .pid файла в недефолтной VarDir для демона searchd и способе указания этой VarDir так, чтобы .pid файл создавался именно там, где надо.

Действительно, поиск по форуму какой-то глючный, с ходу ту ветку найти не удалось, но суть в том, что для mod_dpsearch DBAddr нужно только в одном кофигурационном файле, а не в каждом, т.е. если указать в двух конфигурационных файлах, то результаты удвоятся, если в трёх - утроятся.

По-моему, не дебаггер нужен, а правильно задавать вопросы на форуме :)

Большинство ваших проблем обсуждалось на форуме проекта. В частности, удвоение результатов при использовании mod_dpsearch зачастую связано с неправильной конфигурацией (ведь у нас не принято читать документацию, правда ? :), и проблемы с нестандартным расположением mysql и прочих используемых библиотек просто решаются явным указанием путей к ним при запуске configure. Ну и естественно, что нестандартную VarDir нужно указывать явно, хотя можно поменять и при сборке, опять же указав опцию для configure.

itman:
Это для людей с дебаггером под мышкой, пардон за каламбур.

Ну это слишком преувеличено :)

Я так и не нашел ни одного mysql сервера старше версии 4.0.7, имеющего такие же проблемы с LIMIT OFFSET как у вас. Может оно всё у вас с дебаггером под мышкой ? :d

Всего: 218