Пишет потому, что какие-то устные обязательства он на себя тогда взял. Да и потом плотно участвовал, например готовил и периодически обновлял все данные, покупал ссылки.
elseif, Вы попутали "витальный" на РОМИПе и "витальный" в Яндексе. Это совершенно разные витальные. :)
Витальный РОМИПа - это "полезный" или "релевантный+" в Яндексе.
Витальный в Яндексе - это однозначно лучший ответ, равных которому практически нет. За исключением некоторых случаев, когда таких витальных больше одного.
Желания владельцев сайтов или оптимизаторов волнуют только их самих. Всем остальным в коммерческой выдаче нужно получить желаемый товар/услугу отличного качества с первой страницы выдачи. А это пока не всегда получается.
Дык, "заказали" и "дали грант" - вообще разные действия, по поводу "гранта" вопрос решился только недавно. :D
Задача была любопытной, с не очевидной концовкой. Все же решение ни разу не стандартное.
Ну и получить грант и потом что-то выкатить никогда бы не получилось - никто в СЕО-отрасли в счет будущих побед такого бабла не дал бы. Так что все финансировалось на свои, и Амазон вместе с пиндосовскими спецами для MapReduce выпили не мало русской крови. :)
Мне регулярно никто ничего не сливает, только иногда и все это слегка случайным образом происходит. От меня процессы не зависят, т.к. мне тайны Яндекса не нужны. Я могу только прокомментировать то, что как-то вытащили другие люди и мне показали на 5 сек. Поэтому про новые факторы не знаю ничего. :)
Про космические корабли не нужно. "Псевдо-", примененное к слову "наука", однозначно трактуется как "лже-". Покажите лживые утверждения в моих статьях. Если Вы с какого-то перепугу решили, что формула в конце статьи является ее заключением, то либо Вы статью не читали, либо ничего не поняли. Попробую объяснить: эта формула дается уже после заключения, когда мы (для прикола) предлагаем метод для определения условной эффективности отдельного донора. Эффективность условная, она прокатит разве что как прикольная пузомерка, если в Сеопульте ее когда-нибудь посчитают. К самой статье эта формула не имеет отношения.
И Вы что, предлагаете в случае банального подсчета невязки формул никогда не писать? Они ведь стандартные. Забавный подход. Вы хоть одну математическую статью в своей жизни написали? Покажите.
Ида - я выше задал вопрос: что Вы из себя представляете в IR? Вы отметили, что занимаетесь информационным поиском, в других постах уже неоднократно рассказали про своих студентов. Где Ваши труды? Неужели их нет? ;)
Смените тон, юноша.
Еще раз предлагаю сменить тон. На РОМИПе я не парил публику, а рассказывал о своих исследованиях, которые, во-первых, прошли независимую проверку у асессоров РОМИПа, а во-вторых - легко верифицируемы. Если Вы считаете, что мы кого-то парили, то покажите свои верифицируемые исследования, в которых Вы никого не парите. :D
Наши метрики работают лучше, чем метрики Яндекса, поэтому мы их и используем. На факторах Яндекса построить устойчивые частотные паттерны не получилось, кстати. Хотя факторы Яндекса нам известны.
А при чем тут среднее значение? Зачем Вы его вообще сюда приписали? :D
Ну так поведайте нам основы, из которых следует, что:
Вы перепутали распределение со средним значением, которое действительно не отражает. Путаетесь в школьных терминах, аднака... :D
В статьях написано о том, сколько сайтов продвигалось. И сколько из них вышло в топ. Какую еще оценку эффективности Вы хотите? Все вроде и так должно быть понятно. Или не? :)
Чтобы говорить о научной новизне, покажите для начала Ваши научные работы в IR, еще раз повторю. Продолжим после. :)
Вы ведь не видели результатов. :D
Большая часть частотных паттернов осталась неизменной на протяжении 8-ми месяцев, пережив не только апдейты, но и пересчеты формулы матрикснета. :)
В среднем на топ-50 гораздо меньше доноров. И кто Вам сказал, что при расчете нужно что-то скачивать? Забавное предположение. Все заранее проиндексировано, построение паттерна занимает незначительное время. Нахождение нужных доноров - уже большее, в среднем около 2 секунд на запрос. Понятно, что для ВЧ/ВК время существенно больше.
Расковалов прочитал простенькие лекции для студентов, рассказав об очевидных и известных вещах. Если для Вас это оказалось любопытным, то у Вас еще все впереди. ;)
Это я, есличо.
Подробнее про "псевдо" можете прокомментировать? :)
Затем, чтобы получить нужный результат. Если Вам не понятен подход, примененный нами в данном случае, то ничего не поделаешь, сходите в школу. "Даже Яндекс" и "трешак" позабавили. Вы ведь не видели формул, но уже сделали вывод. А на основании чего и что Вы из себя представляете в IR, чтобы делать такие заключения вслепую? Я это спрашиваю по праву специалиста - наши метрики обыгрывают яндексовые на реальных тестах в рамках РОМИПа. А ваши? :D
Вы спутали распределение со средним значением. Вам в школу, юноша, за парту.
Откуда вывод, что не отражает? В нашем случае показано обратное, результаты экспериментов видели в статьях? :)
А при чем тут какое-то среднее? Вы на уровне определений не понимаете, зато сделали кучу замечательных выводов. :)
Что за "пресловутая Мера Эффективности, о которой столько говорится"? Приведите несколько цитат про эту меру. Целью экспериментов был вывод документов в топ, вывелось 100%. При этом эффективность Вам не понятна?
Еще раз - будьте добры поподробнее про псевдо. :D
И что значит "стыренная формула невязки"? Невязка считается стандартным методом, что в нем стырено? :D
Очередной апдейт, и что дальше? Частотные паттерны достаточно устойчивы к апдейтам, некоторые прожили 8 месяцев в этих апдейтах без изменений. А топ менялся конечно, и не раз. :)
Почему пропала? :D
И развеселил старика гудмана, молодец. :)
Оказалось пуком в лужу. Может там и плавал чей-то глаз, хз.
Не, это я забыл. В башке все эти факторы не укладываются. :D
Сейчас специально посмотрел - использует. Как и кучу других клик и хост ранков. За многие из которых я бы боллзы кой-кому открутил. :)
Это означает немного другое - правильная накрутка кликов рвет любой топ, как Тузик футболку с лого Яндекса. :D
Это все субъективно. Нужно разрабатывать нормальную метрику качества, особенно для коммерческих ВК/ВЧ. Если есть идеи - нужно обсуждать.
И при чем тут Гугл? Я же написал - лучше Арзамаса, причем скорее всего существенно лучше по внутренним метрикам Яндекса.
Ну хз, на сколько оно развитие. Вот Яндекс не юзает. Остальные - не известно, скорее всего аналогично. :)
В логах Яндекса.
Не, все как раз наоборот. :)
Понятно, что любая сегодняшняя формула ранжирования имеет проблемы именно вне "обученных" запросов. Но, если говорить о Яндексе, то Матрикснет как раз и отличается от прошлых полиномов типа Арзамаса тем, что гораздо лучше экстраполируется на весь пул запросов. Это по оценкам Яндекса, конечно, другие внятные оценки не известны, субъективные не катят. :)
Ну и что касается ранжирования на обученных коммерческих запросах - там-то как раз и траблы. Качество хорошее с т.з. пифаунда и убогое с т.з. здравого смысла и реалий. :D
Мог бы пытаться, но пока интереса не видно, по крайней мере с моей деревенской колокольни. :)
Что за переход? Пэйджранк до сих пор является одним из важных факторов ранжирования в Яндексе, хотя и не самым топовым. Хотя торжественное заявление Садовского "Матрикснет победил пэйджранк" - это не успех, а беда ранжирования. Плохо, что не все в Яндексе это понимают. :)
По количеству уникальных запросов - больше, по доле этих НЧ в логах - меньше.