Dryoma

Dryoma
Рейтинг
12
Регистрация
24.12.2007

Как вы поняли то, что какой-то сайт попал в выдачу вместо вашего? Может быть просто ваш сайт упал?

Smile:
Сорри, что влезаю, но отрицательный эффект от ссылок может получиться по другим причинам
Например, слишком неестественный прирост ссылочной массы.

Неестественный прирост ссылочной массы --- неестественно быстрый или неестественное распределение количества ссылок от их веса --- тоже хороший вариант. Я ни на чем не настаиваю, просто проанализировал довольно любопытную модель с тошнотой которую предложил forseman.

wolf:
А с чего Вы решили, что количество анкоров не взвешенно согласно весу, передаваемому каждым? Во всяком случае, когда работала методика Миныча, для случая текстовой релевантности вхождение термина в title шло с удвоенным весом в tf и с удвоенным же весом учитывалось под корнем в тошноте. Если мне не изменяет память

У меня слишком мало экспериментальных данных чтобы что-то утверждать. Просто я вижу, что тут много людей --- сторонников отрицательного эффекта от ссылок. Модель с тошнотой как я описал мне больше нравится, тем более, что она обладает свойствами модели трастового окна. В этом, конечно, нет ничего удивительного.

Если тошнота работает так как вы говорите, то отрицательного эффекта от ссылок не получится. Насколько я понимаю, этого вы и добиваетесь? (Отрицательного эффекта не будет только по "тошнящему" анкору)

Модель с тошнотой чем-то напоминает траствое окно.

Допустим, тошнота определяется количеством самых частотных анкоров (для простоты анкорывсе одинковые). Тогда общий анкорный вес имеет вид:

Ссылочное=(сумма весов)/(f(кол-во анкоров)).

Если f(x) = 1, то тошнота не влияет на результат.

Если f(x) = x, то итоговое ссылочное равно среднему арифметическому весов ссылок --- малоправдоподобно, т к в таком случае наилучший результат достигается добавлением одной ссылки с наибольшим весом, т. е. втаком случае влияние тошноты слишком сильное.

Разумно предположить, что реализуется промежуточный вариант. Пусть f(x) = sqrt(x) --- так же как было для текста в алгоритме Миныча.

Тогда формула примет вид:

Ссылочное=(сумма весов)/(sqrt(кол-во анкоров)).

Пусть мы добавили одну ссылку. До добавления сумму весов обозначим сумма весов, а кол-во ссылок --- N. После добавления --- сумма весов + вес ссылки, а кол-во --- N+1. Обозначим средний вес ссіылок как средний вес. Тогда ссылчное возросло в столько раз:

sqrt(N/N+1) (сумма весов+вес ссылки)/сумма весов=(1+вес ссылки/(N средний вес))/(1+1/2N).

(для больших N)

Получается, что добавление ссылки имеет смысл при больших N только если вес ссылки больше среднего веса, деленного пополам уже проставленных ссылок. Если вес новой ссылки меньше половины среднего веса, то она дает отрицательный вклад. Имхо это напоминает трастовой окно))

Mephistocs700:
Вот например "доставка", "доставку", "доставке" это одно и тоже слово по мнению Яндекса или разные и выстраивать их он будет соответственно тому как они стоят в запросе.

Все написано в помощи Яндекса:

Yandex:

Морфология
Все слова, которые вы приводите в запросе, по умолчанию ищутся с учетом морфологии. Чтобы отключить ее, используйте оператор ! перед словом (без пробела).
Пример
Запрос !день найдет страницы, где слово день встречается только в такой форме.
Если одна или несколько форм слова совпадает с другими словами, поиск может находить лишние страницы. Указав нормальную форму слова с помощью оператора !!, вы уберете многие из ненужных страниц.
Пример
Запрос !!день найдет все формы слова - дня, дню, днем и др., и не найдет форм слова деть (одна из которых совпадает со словом день).
Независимо от формы слов, Яндекс по-разному учитывает слова, набранные с маленькой и большой буквы.

Так что Яндекс по умолчанию ищет слово со всеми словоформами. Но это не значит, что выдача по слову и его словоформам совпадает. По идее множества сайтов в выдаче совпадают (за исключением таких неоднозначных ситуаций как день), а ранжирование разное --- чтобы жизнь сказкой не казалась

Я создал больше месяца назад несколько сателлитов для экспериментов. Попали в индекс недели через две, а линки с них до сих пор не проиндексировались.

forseman:
пусть изначально а-релевантность по слову была равна 5, а спамность 120, тогда общая а-релевантность была равна 5\120=0,0417

главное, что при появлении ссылки, передающей практически нулевой вес, общая а-релевантность остается примерно той же что и раньше, например она равна пяти - 5
а спамность увеличивается, пусть на еденицу, то есть, становится равна 121
в итоге обща релевантность станет равна 5\121=0,0413 < 0,0417

Насколько я понял, вы так объяняете пессимизацию ссылочного. Довольно правдоподобно, разве что непонятно зачем Яндекс в таком случае пишет, что он нашел сео ссылки и снял их? Он что хочет сеошнегу добра??? :)

Кроме того, в этом случае пессимизация будет запросозависимой. Это легко проверить.

А как вы относитесь к пессимизации статвеса? Или вы считаете, что спамность анкор листа учитывается и при подсчете статвеса?

wolf:
А почему оно должно зависеть? Вроде как | - это логическое "ИЛИ"

Тем не менее зависит. В этом легко убедиться. Например, по запросу оптимизация | банан страница vip-adv выше чем d-optima, а по запросу оптимизация | корпускула --- наоборот. Причем, слов корускула и банан на этих сайтах нет :)

wolf:
А что удивительного вт ом, что здесь имеет место транзтитивность? Удивительнее было б, если б её не было.

Если в такого рода запросах каждому сайту насчитывается релевантность независимо от остальных сайтов, вписанных через |, а затем результат упорядочивают по релевантности, то в этом действительно нет ничего удивительного. Но могло быть и по другому. Например, в запросах типа слово1 | слово2 ранжирование сайтов найденных по слову1 зависит от слова2.

wolf:
Так ищет оператор domain. Для оператора url словом является весь URL

Т. е. ищет по урлам, все урлы состоят из одного слова и имеют одинаковый и большой idf?

Поскольку текст урла состоит из одного слова, то и тошноты одинаковые (если имелась в виду тошнота всего текста, то именно тошнота скорее всего и определяет ранжирование). Тогда, если статвес учитывается, ранжирование должно идти по статвесу. Если не учитывается --- то результаты имеют одинаковую релевантность и ранжируются по каким-то дополнительным параметрам))

Запрос #url="site1.ru"|#url="site2.ru" хорош тем, что если мы выяснили, что site1 выше чем site2, а потом что site2 выше чем site3, то site1 выше чем site3 (проверено). Кроме того, через | можно вбивать сколько угодно сайтов и при этом их порядок соответствует порядку, определенному по двухсайтовым сравнениям. Короче говоря при его помощи можно однозначно упорядочить сайты. Имхо это свидетельствует о том, что в таких запросах ранжирование идет по каким-то статическим параметрам, типа статвес (хочется верить, что такие запросы обрабатываются не отдельным алгоритмом). В любом случае приятно, что в таких запросах переколдовка оператора | не влияет на ранжирование.

Всего: 58