Оба-на... Яндекс учитывает в текстовой составляющей ранжирования линки? Или Расковалов просто для большей убедительности про линки вставил? Типа на роеме все равно не просекут? :)
Если в обработчики текстов придется теперь втыкать токенизаторы, то это как-то кисловато слегка. :)
Даже такой метод не особо катит. Т.к. нет уверенности, что проиндексированное ключевое словечко уже учлось в ранжировании. :)
Вопрос - как взвешенный? Если тупо-среднее, то все разруливает 1 анкор с большим российским пэйджранком (не путать с PR гугла) и бомбинг по ГС. Чтобы такие методы пресечь нужно взвешивать примерно так, как в свое время devzev предлагал со своим "трастовым окном" - строить распределение "жирности" и отсекать длинные хвосты с обеих сторон. Но это как-то маловероятно. :)
Ну да. Остается уповать только на то, что на каждый хитрый MatrixNet найдутся свои метрики с винтом. :)
Кто "что думает"? :)
Я ничего не думаю, не заметил жесткой пессимизации пока. Из собственных проектов некоторые молодые вылетели на 2-ю страницу, но по "бюджетной классификации" им там и место. :)
Кстати, про возраст. Вопрос про "старые ссылки" из той же серии, что и вопрос про "жирные" несколькими постами выше. Поделить их на кучки "молодые"/"не очень"/"старые"/древние"? ;)
У меня тут родились 2 реплики по поводу. :)
1. Зачем отключили фильтры у доноров и "ты больше не последний" /(с) Расковалов/? Я тут чистил-чистил анкор листы, чистил-чистил, а в итоге конкуренты с тупым площадным бомбингом и бОльшими бюджетами повылазили. "Группка оптимизаторского гнева" негодуе!!11 :D
2. Вопрос о "жирных" ссылках. К паре (запрос,документ) по словам Сегаловича прилагается всего несколько сотен признаков. А в анкор-листе документа у некоторых (не будем показывать пальцем) наберется несколько тысяч анкоров, влияющих именно на этот запрос. Естественно, что все они с разной "жирностью". Дык, киньте кто-нить идею, как эти тысячи разных "жирностей" уместились в сотни признаков? На кучки анкор-файл разбили чтоле? Не, ну я еще понимаю, если бы разбили всего на две кучки по мадридскому алгоритму, но что делать с разной "жирностью"? :)
Не правильно. Несколько тысяч факторов в формуле ранжирования теперь учесть невозможно, они не просчитываются, там какие-то "дикие" функции. Просчитать можно признаки пары (запрос,документ), которых несколько сотен по словам Сегаловича. И есть гипотеза, что "примерно одинаково понимание" каких-то из этих признаков может сильно измениться.
Если мета-дескрипшин присутствует в признаках и если такие оценки попадут в обучающую выборку, то да. Но слишком много "если". :)
А кто Вам сказал, что у меня пессимистичный настрой? Мне наоборот интереснее стало.
Некоторые еще и с Яндексом пытаются бороться. :)
Ну не надо, так не надо, спорить бессмысленно на эту тему.
Маловероятно. Я думаю, что сео-топы останутся коммерческими, только сделаются менее просчитываемыми, если не найдутся лекарства. :)
Алгоритм давно уже был обучаем, сейчас сменилась методика обучения.
Отслеживать ухищрения сеошников или дорвейщиков - не единственная задача Яндекса. Сео-запросы в общей массе не составляют большинства. А выдача должна быть адекватной по любому запросу, это в идеале.
Если в обучающую выборку сунуть некоторое количество пар (запрос,дорвей) с низкой "истинной" релевантностью, то по этим конкретным запросам дорвеи конечно же вылетят из топов, а вот найдутся ли таким образом все дорвеи данных типов? Может и найдутся, не зря же у документа сотни признаков. :)
Неоспоримые? А на какой выборке исследовалось? Я по не сложным факторам достаточно много парсю для изучения, закономерностей как бы маловато пока. :)