Chewi

Рейтинг
43
Регистрация
22.04.2005
Напомню интересный пример использования ортогональных запросов

Полезный топик. Правда, обсуждение закончилось на минорной ноте... :) Но, сравнивая сайты по данной методике в настоящий момент, обычно я вижу предсказуемые и логичные результаты. Но не всегда :)

Вообще, методика сравнения выдачи по двум запросам с ограничением по двум урлам теоритически интересная. Но нужно не забывать про чистоту эксперимента - ортогональность запросов, отсутствие внешних ссылок на документ, в тексте которых упоминаются исследуемые запросы, соответствие количества упоминаний исследуемых запросов в тексте документов и т.д.

Но даже при соблюдении всех вышеперечисленных условий наблюдаются проблемы, о которых говорил wolf в этом посте - /ru/forum/comment/1711948. О причинах этих проблем, насколько мне известно, на форуме еще никто не писал (если не считать попытки объяснить результаты, расходящиеся с теорией, так - "да, там алгоритм наверное какой-то другой или его там вообще нет...").

Хмм, на счет “вИЦ” я погорячился…

Пример не годится для анализа.

wolf:
Даже, если на него нет внешних, это отнюдь не значит, что ВИЦ'ы всех страниц одинаковы. Да и к тому же количество вхождений термина из запроса на разных страницах разное. Чистоты эксперимента нет у Вас.

Сергей, согласен, что чистоты эксперимента нет. Да и эксперимента тоже нет, просто пример, который нашел навскидку.

Это к вопросу о “тошноте”. Получается, что страница, где у нас tf_max является именно запрашиваемым термином, в выдаче стоит ниже, чем страницы, у которых tf_max не является запрашиваемым термином. При том, что у этой страницы “вИЦ” побольше будет: http://www.yandex.ru/yandsearch?stype=&nl=0&text=%28url%3D%22www.dakrus.ru%2Ffaq.htm%22%29+%7C+%28url%3D%22www.dakrus.ru%2Fcatalog%2Fbalkony%2F%22%29

Т.е по такому запросу:

http://www.yandex.ru/yandsearch?text=%E2%20%3C%3C%20url%3D%22www.dakrus.ru*%22&pag=u&surl=dakrus.ru&

Должна бы выдаваться страница /faq.htm.

Или не должна… )

upyrj:

Chewi, не уверен. Но imho рановато анализировать новый алгоритм.

Алгоритм новый уже в работе, что мешает его анализировать?

На счет влияния tf_max, вот пример, который нашел.

Берем сайт, так чтоб не было внешних ссылок:

http://www.yandex.ru/yandsearch?text=link%3D%22www.dakrus.ru*%22&rd=0

Теперь отдаем Я такой запрос:

http://www.yandex.ru/yandsearch?text=%E2%20%3C%3C%20url%3D%22www.dakrus.ru*%22&pag=u&surl=dakrus.ru&

первая страница выдается: */balkony/ tf_max = 6 (ограждения)

вторая страница выдается: */perila/ tf_max = 4 (перила)

третья страница выдается: */zabory/ tf_max = 4 (ограждения)

и только на 5-м месте страница:

*/faq.htm tf_max = 10 (в)

upyrj:

Давайте, что ли примеры морд про бегемотов сделаю:
(1) http://ivanov.in/mm/hipp1.html
(2) http://ivanov.in/mm/hipp2.html
Я полагаю, что вариант (2) будет значительно лучше, чем вариант (1).

PS продам ссылки со страниц про аукцион бегемотов. 8)

Уверены, что тошнота в новом алгоритме все также зависит от tf_max?

Поговорила тут с одним челом, он утверждает, что система получается очень ресурсоемкая, вплоть до того, что надо ставить на отдельную машину...

И у меня тоже такое ощущение сложилось. К тому же, стоит довольно дорого, так сказать, "бесплатный" :) вариант у меня не заработал - там все завязано на их сервер. Лицензия на этот продукт покупается на определенное число обрабатываемых страниц в месяц, по-моему. Так что продукт, конечно, очень мощный, но использовать его для своего хоум-пейдж или партнерского инет-магазина невыгодно :)

Можно, но не очень удобно - уж больно он громоздкий (принцип локального использования такой же, как и на сервере - на локальный компьютер устанавливается веб-сервер и с его помощью работает WebTrends, при этом постоянно висит в памяти еще не меньше 5 каких-то сервисов вебтрендсовских)...

Кстати, я остановился все-таки на WebTrends - альтернатив ей, похоже, нет.

Нужен проверенный список немецких директорий.

Кто-нибудь может помочь?

2mihas - отзовитесь!

Игра "Я спросил у Яндекса"

Запрос - "смысл жизни"

http://www.yandex.ru/yandsearch?text=%F1%EC%FB%F1%EB+%E6%E8%E7%ED%E8&stype=www

Смотрим первую ссылку сверху. Яндекс и тут не обнадежил ;)

Всего: 129