wolf

wolf
Рейтинг
1183
Регистрация
13.03.2001
Должность
интернет-маркетинг, SEO
devzev:
С чего вы взяли? Это бизнес.

Что-то мне подсказывает, что Вам никогда не стать руководителем поиска Яндекса. :)

devzev:
Да-да-да. Был бы я руководителем Яндекс-поиска я бы написал, что в ранжировании участвует 10000 параметров. Так солиднее и страшнее.

Я думаю, если б Вы были руководителем Яндекс-поиска, то мысль о мелкой лжи Вам просто не пришла бы в голову.

devzev:
ИМХО: Выборка для оценки и обучения маловата была.

Экак Вы с ходу определили. :)

empowered:
Хм, у меня выдача разная.
/ru/forum/418288

Не путайте выдачу с галочкой и выдачу по умолчанию

devzev:
Ранжирующую функцию можно либо строить с нуля, либо использовать уже ранее полученные результаты. Нынче похоже на первое.

Можно и штаны через голову надевать. Не знаю, что у Вас там на что похоже, но иногда, чтоб не выглядеть смешным, лучше ознакомиться с теорией. Функцию от заявленных тысяч параметров ни с какого нуля не построить. Здесь возможно только обучение и только генетика.

G00DMAN:
С генетикой нужно реально на уши вставать как математикам, так и программерам, чтобы быстро было. Не думаю, что Яндекс нашел таких спецов, потому и траблы.

Дык здесь под greedy algorythm наверняка подразумевается жадная генетика. Ну, это когда жадный алгоритм используется для получения нового поколения в генетическом алгоритме.

G00DMAN:
pfound больше не используется. Теперь рулит жадный алгоритм.

Хм... А зачем сравнивать метрику с алгоритмом? В той же презентации Гулина и Карповича приведены примеры по крайней мере четырех метрик. И теоретически ничто не мешает использовать и pfound вместе с жадным алгоритмом (кстати, откуда уверенность, что жадный алгоритм не используется в Арзамасе?). Вместе с тем, я не уверен, что в Арзамасе используется именно pfound. Предполагаю, что эту метрику использовали чисто для РОМИПа. Т.к. для поиска по вебу, на мой взгляд, недостаточно максимизации вероятности найти один релеватный документ. Надо обеспечить максимально релевантную выдачу хотя бы в первой десятке.

G00DMAN:
Посмотрим, как жадность справится с релевантностью, я пока не уверен, что идея хорошая. Некоторый максимум такое обучение находит, один из бесконечного множества. И не факт, что хороший, не говоря уже о лучшем...

Это можно сказать о любом генетическом алгоритме.

devzev:
Анализируя 3 дня буку я пришёл к такому выводу: в выдаче не участвуют оценки ассесоров. Т.е. мы видим реально голый алгоритм без ручной корректировки.

Осмелюсь поинтересоваться, а как в алгоритме "Learning to Rank", на который Яндекс прочно подсел уже пару лет как, могут не участвовать оценки асессоров сиречь обучающая выборка? Или Вы можете предложить, как строить ранжирующую функцию от нескольких тысяч параметров каким-то иным способом? Если да, то Вам надо его срочно запатентовать, это будет революция в Information Retrieval :)

devzev:
PS2: а ещё я в буках не вижу фильтра "Ты последний".

Да-да, Расковалова на ночь тоже читаем ;)

caTaHucT:
за подбор и составление анкоров

А каким образом анкоры влияют на ТИЦ???

shultz1988:
Каким пользователям присваивают регион "Москва", а каким "Москва и область"? Где будет на ваш взгляд больший трафик? Просто позиции для этих двух регионов на примере моего сайта довольно сильно различаются.

Вообще-то, выдача для "Москвы" (lr=213) и "Москвы и области" (lr=1) должна быть одинакова

t_o_x_a:
Проиндексированность можно проверить, посмотрев в сохраненную копию страницы.

Справедливости ради стоит отметить, что сейчас режим "Сохраненная копия" не всегда показывает именно сохраненную копию. Иногда там показывается текущая версия страницы, берущаяся на лету с хостинга.

Всего: 24501