Та, которую твои коллеги по ветке вебэффектора называют "текартовской". ;)
В это я пока верю. Но считаю высоковероятным вариант, что "бабушка" ошиблась.
Если бы у бабушки были методики проверки "рабочести" ссылок... :D
Собственно, все крутится вокруг этого и упирается в вопрос веры в результаты исследований "бабушки". Но, если вспомнить предыдущую теорию "рабочести" от той же "бабушки" времен Текарта (и немного после), то верится уже с трудом, подозрительно все. Т.е. "бабушка" может и искренне верит в свою методу, но я, например, уже сомневаюсь. ;)
Не понятно, почему ты так упростил определение, вроде изначально не было никакого -100, было хитрее как-то.
Я считаю, что нет никакого -100 в спам-фильтре, далеко не всех именно так далеко выкидывали, а появление большого числа фильтров одновременно маловероятно.
Стат. вес наверняка отдельно, нет смысла приурочивать его к "ссылочным" апдейтам. А вот "стат. вес по запросу" - вообще не очевидный фактор, может и нет таких сейчас.
А почему нет? Фильтр занижает релевантность одного документа, что не означает, что эта релевантность не останется максимальной по запросу на сайте.
По поводу задержки с влиянием изменений свойств документа на выдачу я вроде уже писал, что самая простая гипотеза видится такой. Среди факторов ранжирования появилось достаточно много метрик, требующих для вычисления определенных ресурсов. Поэтому "на лету" вычислять не успевается и запускаются независимые параллельные процессы, обсчитывающие метрики на документах, у которых изменились какие-то свойства (например изменился размер документа, дата создания или появились новые ссылки). Причем не понятно, сколько таких процессов запущено одновременно, т.е. разные факторы измененного документа могут быть обсчитаны в разное время и выложиться в разные апдейты.
P.S.komdir, классно отжигаете. :D
Не обязательно по модельным. Хотя, ввиду того, что для модели собирают параметры по максимуму, то пессимизирующие метрики строятся на похожих параметрах.
Что Вы называете "поведением сайта"?
Можно, но это не поможет. Т.к. асессор, не видя оценки ссылочного, оценит документ с плохими X-Y так же, как и с хорошими Y. И такие факторы на основе только Х будут путать систему, сходимость обучалова сильно пострадает, а выигрыш не особо понятен. На самом деле мы этот вопрос немного странно обсуждаем - я на первой странице писал о том, что пессимизирующие фильтры (например за текстовый спам) проще делать после ранжирования, оно наверняка так и происходит. Ты как-то перевел все на "хорошие" ссылки. Их я не готов обсуждать, т.к. для начала нужно в них верить, а я пока не видел убедительных доказательств. Но, если допустить, что такие "элитные" ссылки есть, то да, они как-то могут и факторами в матрикснете выделяться, как вариант. В пессимизирующие фильтры за отсутствие ссылок Y вообще сложно поверить. :)
Для меня это очевидно. Одни пытаются что-то сравнивать и что-то увидеть, а другие аналогичные матрикснету и более сложные задачи неоднократно решали, потому им в некоторых вопросах не нужно строить догадки. ;)
Не катит. В последнем фильтре за текстовый спам из индекса документы практически не выкидывали. Была обычная пессимизация релевантности по запросу. :)
Вопрос не совсем в тему топика, и ответа на него однозначного нет - всякое бывает. Прямой корреляции между "еще с сайта" и авторством также нет, там сложнее все. Яндекс пытается этот вопрос решать, но задача сложная, в ближайший год-два красивого решения еще не будет.
Не X, а X-Y, т.е. все внешние, которые не вошли в "хорошие". Потому что:
Почему нет? Ранжирование вроде для всех тематик одинаковое.
Предложите хотя бы один повод для наказания всего сайта, если на одной из его страниц зафиксирован спам.
Что еще за матрица? 😮
Не так. До этого они были "в уме", но не показывались, т.к. проигрывали в накрутке "боевым". Таких примеров не один, их было немеряно в то время, особенно в темах про апы. Если допустить, что пессимизация за спам занижает релевантность запросу всего сайта, то почему меняется релевантная страница? Или пессимизируем страницы сайта по разному, по сложной формуле? Мне кажется, что слишком мудрено выйдет, куча лишних не нужных вычислений.