Фильтрация по кворуму - вопрос про пассаж

12
E
На сайте с 31.01.2007
Offline
10
3216

Такой вопрос созрел - при фильтрации по кворуму что считается пассажем? Только найденные в документе слова из запроса или весь контекст, который охватывается запросом?

И более общий вопрос - пассаж в Яндексе при ранжировании все-таки запросозависим, или нет? То есть документ разбивается на пассажи при индексировании или уже в процессе поиска?

Долго читал спор Euhenio и Wolf-а, не понял :confused:

PS Может быть кому-то спонадобится, написал утилитку, которая:

а) выдергивает с Яндекса переколдованный запрос

б) оценивает простым перебором, какие слова из запроса должны входить в найденный пассаж для преодоления фильтрации по кворуму.

Первая версия (online) требует уже переколдованного запроса - http://test.pavlovo.org/s/filter.php, вторая

(только для скачивания, PHP) - запрос делает сама и получает из Яндекса переколдованный - http://test.pavlovo.org/s/quorum_match.zip

Весь алгоритм - по мотивам доклада Евгения Трофименко на конференции'06.

wolf
На сайте с 13.03.2001
Offline
1183
#1

Да уж, вовремя вы с утилиткой. Ибо, похоже, кердык колдунщику для масс. Параметр regtext с сегодняшнего дня в URL'е подсветчика пустой. Слабо верится в глюк, похоже доигрались. Яндекс закручивает гайки?

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
MiRaj
На сайте с 03.07.2006
Offline
509
#2
wolf:
Яндекс закручивает гайки?

видимо да..

придется теперь по-другому переколдовку смотреть :)

Муркетолог. 100 пресс-релизов с прямыми ссылками за 150 баксов? Легко! (http://b2blogger.com) Статейный маркетинг - лучшее лекарство от Минусинска! (http://miralinks.ru)
wolf
На сайте с 13.03.2001
Offline
1183
#3
MiRaj:
придется теперь по-другому переколдовку смотреть

Это как? ;)

MiRaj
На сайте с 03.07.2006
Offline
509
#4
wolf:
Это как?

ручками ;)

вес считается элементарно, а пока не прикрыли подсветку в сохраненной копии, то и расстояния тоже.

пока.....

wolf
На сайте с 13.03.2001
Offline
1183
#5
MiRaj:
ручками

Ручками - это угрюмо... :)

MiRaj
На сайте с 03.07.2006
Offline
509
#6
wolf:
Ручками - это угрюмо...

а много ли надо?

SyncMaster
На сайте с 05.02.2007
Offline
12
#7
MiRaj:
ручками ;)
вес считается элементарно, а пока не прикрыли подсветку в сохраненной копии, то и расстояния тоже.
пока.....

в "сохраненной копии" уже убрали ... если я не слеп и у меня не глюки :)

Бьешь в репу? Подпишись трус >_> Продаю душу за жирные морды :)
E
На сайте с 31.01.2007
Offline
10
#8

Аааа!!! Блин. Ну надо ж так попасть. Как раз когда отлаживал - все работало. Думал, сегодня пообрабатываю данные... :(

Нескромно так: мож из-за утилитки и убрали?

PS Подсветка вроде на месте.

E
На сайте с 31.01.2007
Offline
10
#9

Да, Сергей, а не ответите про пассаж? Как он все-таки считается - как предложение (с выкидыванием длинных при запросах вида АА && BB) или все-таки как фрагмент документа?

Тогда, если первое, то в расчете релевантности будут участвовать все слова из пассажа, выходит, не только то, что оговаривает запрос??

wolf
На сайте с 13.03.2001
Offline
1183
#10
eolin:
Да, Сергей, а не ответите про пассаж? Как он все-таки считается - как предложение (с выкидыванием длинных при запросах вида АА && BB) или все-таки как фрагмент документа?

По этому вопросу современная наука единой точки зрения не имеет :)

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий