G00DMAN

G00DMAN
Рейтинг
122
Регистрация
19.04.2008
Sim:
Коля крут. Выращивает новую, специальную породу людей: пользователей сеопульта.

Не только крут, но и могуч. Не каждому дано вырастить свой кормящий фан-клуб. :)

n_e_o:
Конверт в биллы можно только через месяц считать, но на текущий момент месячный оборот пользователей составил 23% от бюджета на данню рекламу, что достаточно слабо.

Конверт посчитать будет сложно, т.к. не все побегут в Сеопульт сразу. Но в целом должно получиться не совсем кисло, как я думаю.

Digital Helen:
G00DMAN, как Вы считаете, могут ли поведенческие показатели коррелировать с:
а) источниками перехода на сайт в целом;
б) типом поискового запроса, по которому пользователь перешел на сайт, в частности.

Например, для пользователей, перешедших на сайт по запросу "слон", глубина просмотра, время на сайте и т.д. имеют один оптимальный диапазон, а для пользователей, передших по запросу "купить слона" - другой?

Факторы коррелировать не могут, иначе они бы не брались в модель.

Я уже писал, что поведенческих факторов у Яндекса много, есть и зависящие от конкретной пары (запрос, документ), есть и средние по хосту, есть и по урлу.

Scaryer:
Прошу сильно не пинаться. Возможно, эти картинки развеют чьи-то иллюзии относительно "уникализации" или натолкнут на свежие мысли.

Свежие мысли можно в более правильных местах искать, например на РОМИПе. В этом году Яндекс сделал доклад по поиску дубликатов: Поиск похожих изображений и дубликатов (слайды). Там вроде достаточно подробно расписано, что и как делается.

Elbran:
А Ваш фотоаппарат Пушкина от Лермонтова отличает?

Мой находит гудмана в кадре, умный гад. :)

В ветке уже не раз упоминалась книга: Кристофер Д. Маннинг, Прабхакар Рагхаван, Хайнрих Шютце "Введение в информационный поиск". Это на сегодня единственная современная книга о писке на русском, больше книг нет. Книга актуальная, в оригинале она вышла 2008 году. Кроме большого объема информации в книге есть также замечательная библиография, большинство знаковых трудов по поиску в нее вошли. Полезно читать всем.

Из статей на русском можно смотреть сборники докладов на семинарах РОМИП, RCDL и Диалог.

Есть поводы вернуться к теме ветки. :)

webpavilion:
Подскажите еще факторов на которые стоит обратить внимание?

Я вот забыл еще Диалог упомянуть, Вы читаете труды оттуда?

Вот например труды 2010 года.

Понятно, что там разного качества статьи, хотя наверняка есть и интересные. Типа таких:

Метод определения массово порождаемых неестественных текстов - понятно, про что это. :D

КОМПИЛЯЦИЯ ИЛИ… ЯЗЫКОВЫЕ КЛИШЕ? - попытки определения авторства.

G00DMAN:
В n-граммы пока не стоит копать, максимум - в биграммы. Нового инсайда от Яндекса на эту тему нет, прошлогодние ссылки я постил недавно:

На сегодня информация изменилась - в триграммы копать нужно. :)

юни,вот когда Кокос сделает свой поисковик и будет говорить про его ранжирование - тогда и послушаем. А пока не интересно ни разу. :)

юни, да и пусть себе говорит.

Достоверно известно, что Яндекс собирает поведенческие данные из:

  • кликов по собственной выдаче
  • Яндекс.метрики
  • Яндекс.бара в браузерах пользователей
  • статистики LI

Данных из этих источников собирается много и на них строится очень много факторов, десятки, если не больше.

Все полученные факторы влияют на выдачу. Поэтому вопрос о том, что ставить на сайт, метрику или LI, не имеет однозначного ответа. Иногда не стоит ставить ни одного, ни другого. :)

Медведев клоноводит:

Дмитр Медвед

Дмитр Анатол

Но его кореша с клонами френдиться не хотят почему-то. :D

webpavilion, на самом деле что там Яндекс купил - дело темное, не все так просто... :)

Всего: 1960