- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Wolf, и ещё - получается, раз у них там полином, значит никакой тошноты или длины документа в знаменателе нет.
А это значит, что она не всегда влияет отрицательно, но в связке с другими параметрами, может давать и положительный вклад (прямой вывод из формы формулы релевантности).
Wolf, и ещё - получается, раз у них там полином, значит никакой тошноты или длины документа в знаменателе нет.
"Тошнота" может быть составной частью одного (или нескольких) факторов. Вы упоминаемые в статье факторы повнимательней изучите. Например, "группу факторов на основе формулы Okapi_BM25".
Да, и что Вы, собственно, подразумеваете под "тошнотой"? :)
Не совсем. Метрики могут быть разные. Например, упоминаемая в "Яндекс на РОМИП'2009" метрика pfound отнюдь не минимизирует невязки (о чем говорите Вы), а максимизирует вероятность нахождения релевантного результата при последовательном просмотре юзером выдачи сверху вниз. Всё таки несколько разные вещи.
pfound зависит от pRel, а там написано, что:
релевантности по запросу
dlyanachalas добавил 31.10.2009 в 19:02
"Тошнота" может быть составной частью одного (или нескольких) факторов. Вы упоминаемые в статье факторы повнимательней изучите. Например, "группу факторов на основе формулы Okapi_BM25".
Зачем так делать, если можно все эти параметры объединить универсальной формулой (о чем и идет речь в докладе).
Количество вхождений самого частотного термина в документ.
Зачем так делать, если можно все эти параметры объединить универсальной формулой (о чем и идет речь в докладе).
Хорший вопрос. Задайте его Сегаловичу при случае.
pfound зависит от pRel
Слушайте, у меня нет ни желания, ни времени разжевывать Вам то, по чему Вы наскоком пробежались по верхам (в том числе и "википедические" статьи о генетических алгоритмах). Скажу одно - читайте внимательно первоисточники.
Количество вхождений самого частотного термина в документ.
Это частный случай. Миныч же под тошнотой имел ввиду более широкое понятие, а именно - нормировку tf*idf (В той же BM25, например). Сегодня она нормируется по самому частотному термину, завтра - по длине документа. Где-то у ХРНС этот момент оговаривался
Это частный случай. Миныч же под тошнотой имел ввиду более широкое понятие, а именно - нормировку tf*idf (В той же BM25, например). Сегодня она нормируется по самому частотному термину, завтра - по длине документа. Где-то у ХРНС этот момент оговаривался
Я вообще-то о том, что в формуле релевантности нет знаменателя. А что там имел в виду ХренРедькиНеСлаще - десятое дело.
Про википедию, хорошо сказано, но я изучал эти функции, когда в НИИ работал.
Удачи в исследованиях)
Я вообще-то о том, что в формуле релевантности нет знаменателя.
Найдите формулу BM25 и внимательно проанализируйте. Даст Бог, и заметите знаменатель
но я изучал эти функции, когда в НИИ работал.
В каком году работали, если не секрет? И кем?
А что там имел в виду ХренРедькиНеСлаще - десятое дело.
Воля Ваша, но термин "тошнота" все таки ввел именно Миныч, и думаю, его мнение (и членов его команды) здесь не последнее. Хотя, еще с тех времен под "тошнотой" каждый понимал что-то своё. Эдакий сакральный смысл свой вкладывал. :)
Что я могу сказать, так это то, что БДБД _не_ захватит мир)
Наша мини-конкуренция по одному из ВК закончилась в мою пользу с вводом Снежинска :)
Да нет там уже таких формул. А если и есть, то они вносят незначительный вклад.
Считаю, что Гудман вчера правильно написал. Они используют какое-то самопальное подобие рядов для получения соответствия выдачи, сформированной алгоритмом, и ручной выдачи, сформированной ассессорами.
Итог - в выдаче или ручная правка, или гауно (там, где ручной правки не было).
Считаю, что Гудман вчера правильно написал. Они используют какое-то самопальное подобие рядов для получения соответствия выдачи, сформированной алгоритмом, и ручной выдачи, сформированной ассессорами.
Где это GOODMAN такое писал?
Где это GOODMAN такое писал?
Здесь. А что, данный факт вызывает сомнения?
Здесь. А что, данный факт вызывает сомнения?
Мы с вами Гудманов спутали:) Есть: GOODMAN и G00DMAN. Писал 2-й.