оператор && - странная работа...

Analitik2000
На сайте с 11.09.2006
Offline
5
1304

Всем здрасьте...

Вот, обнаружил одну интересную вещь... не могу никак до конца разобраться...

Итак, эксперимент. Берем страницу http://www.aup.ru/books/m79/6_1-6_2.htm.

Берем абзац "Разновидностью (...46 слов...) проекта. Различаются цепной ..."

Слова "разновидностью" и "цепной" идут в соседних пассажах.

Зададим при поиске на странице следующий запрос (разновидностью::10000 &&/(0 1) цепной::10000) - ничего не надено!

Хорошо, задаем (разновидностью::10000 &&/(0 2) цепной::10000) - пассажи найдены, слова подсвечены.

Получается, счет идет с начального пассажа, т.е. у него 1.

Хорошо, смотрим (цен::10000 &&/(0 1) различаются::10000) - слова расположены в тех же соседних пассажах, но теперь при ограничениях (0 1) пассажи найдены! (является::10000 &&/(0 1) цепной::10000) - аналогично, все находится. Получается счет идет не с единицы, а с нуля, как при одинарном &. Но! В двух последних примерах, позиции первого слова дальше в первом пассаже, чем позиция второго слова во втором пассаже, пробуем, чтоб было наоборот - (является::10000 &&/(0 1) увеличение::10000) - не найдено ничего!!! Расширим границы - (является::10000 &&/(0 2) увеличение::10000) - находится. Берем другое слово в первом пассаже, подальше - (основных::10000 &&/(0 1) увеличение::10000) - опять все найдено!

Проверим теорию, но теперь два слова будут разделены одним пассажем.

Позиция слова "разновидностью" - 1, "усредненные" - 7 Пробуем - (Разновидностью::10000 &&/(0 2) усредненные::10000) - не найдено, увеличиваем расстояние (Разновидностью::10000 &&/(0 3) усредненные::10000) - все найдено!. Берем слова с одинаковыми позициями - (основных::10000 &&/(0 2) усредненные::10000) - все находится.

Соответственно, будет найдено по запросам с контекстными: (1 2) (2 2) (2 3) (2 4) и т.д, главное, чтобы двойка была. Все правильно, все найдено. Пробуем на запросе (Разновидностью::10000 &&/(0 3) усредненные::10000).

(1 3) (2 3) - найдено, (3 3) (3 4) - не найдено - почему???

Вот последнее непонятно. Совсем.

Может, кто знает, в чем дело?

Analitik2000
На сайте с 11.09.2006
Offline
5
#1

Ах, да. Еще один вопрос (в первую очередь это к господам, дискутирующим по поводу текстовой релевантности)

А как считать кворум при && ???

Может быть расчет такой? - Если были найдены слова из запроса (может быть и не все), удовлетворяющие контекстным ограничениям (назовем их "подсвеченные" слова) и проходящие кворум, то все пассажи, где есть "подсвеченные" слова - релевантные и по ним считается текстовый вес.

Например, запрос "мумие лечебное купить". Находим "мумие". От него ищем "лечебное", находим, ищем "купить" - не находим, однако "мумие" и "лечебное" кворум проходят, поэтому два найденных слова учтутся при расчете релевантности. Ищем дальше. Находим еще одно "мумие", больше в окрестностях, заданных ограничениями, нет слов из запроса. Одно слово "мумие" кворум не проходит, поэтому при подстчете релевантности его не учитываем...

_________________________

Как Вам такая гипотеза? никто не проверял?

Пойду дальше думать...

😕

АК
На сайте с 05.08.2006
Offline
76
#2

Ой, с моим сайтом экспериментируют :)

Analitik2000
На сайте с 11.09.2006
Offline
5
#3
Ой, с моим сайтом экспериментируют

Да лана, хуже не будет, зато - реклама бесплатная! ;)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий