HTDIG: настройка поиска

12
PL
На сайте с 04.10.2003
Offline
75
#11
POLL:

А интересно, HTDIG можно настроить так, чтоб он индексировал только определенный кусок текста на странице, помеченный тегом каким-нить? А то же, ссылочное ранжирование внутри сайта мне совсем ни к чему.
Такое возможно?

Оказывается это просто, ненужные места просто осекаются такими метками (по дефолту):

<!--htdig_noindex--> <!--/htdig_noindex-->

PL
На сайте с 04.10.2003
Offline
75
#12

Кто нить может знает - как научить htdig работать с русской буквой "Р"?

И если для него словари синонимов?

PL
На сайте с 04.10.2003
Offline
75
#13

Так я и не нашел патча для htdig, чтоб он искал по всем буквам...

Вот на opennet.ru буква "Р" при запросе обрабатывается, а у меня - если в слове она есть - ничего не найдено.

Может дело в кодировках - у меня стоит виндоус.

[Удален]
#14

Как виндоус? соляра ж была?

На FreeBSD и на Linux он ищет с буквой "р" без каких либо патчей.

PL
На сайте с 04.10.2003
Offline
75
#15
Interitus:
Как виндоус? соляра ж была?
На FreeBSD и на Linux он ищет с буквой "р" без каких либо патчей.

Система солярис (posix), а вот кодировка страниц у апача 2 - windows-1251

PL
На сайте с 04.10.2003
Offline
75
#16

Вот, что я заметил у себя в db.wordlist

У меня на странице, например есть слово "переведено".

Оно же в моей базе будет - "еведено" и соответственно его можно найти задав в поиске "еведено".

Аналогично со словами:

превзошла -> евзошла

определены -> еделены

представитель -> едставитель

Президент -> езидент

процента -> оцента

борьбу -> ьбу

удовлетворяющих -> яющих

Зато, вот есть на странице слово "Реклама" - так оно считается и выдается, тока если так же (с большой буквы его писать) - иначе ничего не найденно.

Чудеса ваще.

Еслиб ваще ничего неискало я б думал что, что-то в локале ( у меня прописанно просто: locale: ru_RU). А так даже и не знаю - куда копать-то :)

Ваще у меня стоят такие локали:

C

POSIX

ru

ru.UTF-8

ru.koi8-r

ru_RU

ru_RU.ANSI1251

ru_RU.ISO8859-5

ru_RU.KOI8-R

ru_RU.UTF-8

[Удален]
#17

Покопал я свою старую переписку, когда с этой буквой "р" столкнулись на Линуксе, тоже стареньком, еще кажется на 2.2 ядре. Так вот вылечилось установкой локали ru_RU.CP1251 (именно CP1251 критично).

PL
На сайте с 04.10.2003
Offline
75
#18
Interitus:
Покопал я свою старую переписку, когда с этой буквой "р" столкнулись на Линуксе, тоже стареньком, еще кажется на 2.2 ядре. Так вот вылечилось установкой локали ru_RU.CP1251 (именно CP1251 критично).

Спасибо, Interitus!

Помогло, в конфиге прописал локаль ru_RU.ANSI1251 и теперь полный порядок с буквами :)

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий