Это уже пройденный этап. Вторая порция опия тоже будет бесплатно! :)
Кстати, wolf? f если мы не так будем кукарекать, а несколько по другому:
У Вас стоит две сссылки по сто баксов и третья за 50. Так вот дорогой клиент, эта третья в два раза эффективнее первых двух (т.е. только четырьмя такими первыми Вы сможете перебить последнюю третью.
И потом есть еще масса возможностей. Кстати, wolf, Вы поняли, почему Вы в мерянии ВИЦА проигрываете? И почему морда Вашего Текарта могла бы в два раза примерно эффективнее быть по Вашим любимым запросам, причем просто по мановению волшебной палочки??
А что от меня то надо? Чтобы я сделал не монотонную или понижающую?
Первая опция опия для народа бесплатно :)
Кстати, а я только еще в начале пути :)
ВИЦы, доноры и больные, длина ссылок, число ссылок, оптимизация ссылок, "склейка" (гы-гы), разные тексты ссылок, одинаковые тексты, асимптотическое поведение линкатороподобных систем...
Впереди еще много серой работы для серых наших мышей. Или это уже никого не интересует, потому что Яндексоиды давно все это уже разжевали и раскрыли и всё давно всем известно??
Э, да лед тронулся, граждане-заседатели.
Все в полном соответствии с теорией развития любой научной доктрины: три стадии.
1-я стадия: что за чушь? Что за бред?
2-я стадия: в этом что-то есть....
3-я стадия: да тут и ежу десять лет назад было понятно! Изобрели велосипед. Да сами сотрудники Яндекса все давно разжевали и разъяснили 😂 😂 😂
Похоже, 3-я стадия уже назрела. :D :D :D
ВЫ неправы. Это тоже труд, причем наиболее время-затратный. А Вы знаете такую фразу: "нехватка времени"?
jklm это формулы экселя , взятые от весов, найденных в эксперименте. Почему именно такие? Считайте, что мне так показалось удобным.
M,S столбцы это чисто вычислительные, они дают возможность следить за тем идут ли ступеньки регулярно и позволяют сравнивать размеры ступенек для разных запросов и разных страниц (для наглядности). То, что при делении они при больших весах дают целые числа (можно считать число ступенек, если ступеньки идут друг за другом а не через 2-3-4-5 и тд.) весьма показательно. Время от времени там идут сбои (прогнозируемые, так как ВИЦы разные и наклон "лестниц" разный, он не может точно совпадать с отношением ширины ступени к ее высоте), целые числа сразу впечатляют. А когда отношение тошнот (ширины и высоты ступенек) оказывается частным от деления двух целых чисел, это тоже производит впечатление, когда вдруг ты догадываешься, что это за целые числа :)
Будем считать, что эту формулу (она была РАНЬШЕ в алгоритме), мы и проверяем сейчас.
Она отражала, например, антиспамовый коэффициент и модификацию tf степенной функцией со степенью меньшей 1 (а фактически степенью 1/2, как сейчас Вы могли видеть из файликов которые выложены) из работы Маслова, которую уже приводил Wolf: http://www.romip.narod.ru/romip2003/6_yandex-romip.pdf
Возьмите эту формулу для ключевика-самого частого слова, получится корень квадратный из этого самого частого числа: tf^0,5
Искренне, спасибо.
0,5 это за счет того, что я нашел интервал, размером в 1, ВНУТРИ которого реально проходит грань.
Скажем при весе в 10, первой идет страница 202, при весе 11 первой идет страница 203. Наиболее вероятное значение величины ступеньки это (10+11)/2, что я записываю как 10+0,5
Вот я об этом и думаю. А еще думаю, что этим могут вредители воспользоваться. Заколбасить конкурирующей сео конторе ее запросы в самый кривой пик и пусть они следующие три дня над косяками своими думают и время теряют.
Свою тематику само собой не трогаю. Если гдето разгорелся трудовой процесс на косяками, то над нужным мне домом будет спокойнее (закон Ломоносова, если в одном месте что то убудет, в другом присовокупится).
Всегда считал и сейчас считаю, что это гуманитарная профессия. Неужели Бурбаки, это технари?
wolf, А если Яндексу наплевать на наши определения?
Представьте, я меряю, получаю набор чисел. И что мне с ним делать? Понять гармонию и предложить функцию, которая лучшим образом аппроксимирует этот набор чисел и позволяет предсказывать ситуации, не входящие в полученный набор чисел.
Аналогия: Вы предлагаете мне использовать ряд Тейлора. А я почему то хочу ряд Фурье, в том числе и потому, что в рядах Тейлора ничего не понимаю.
И еще. Не хочу я таких определений, которые сами же и заводят в ловушку.
Вот почему тошнота, а не tf_max? Да потому, что завтра Яндекс возьмет и будет tf делить на сумму ДВУХ самых tf-истых слова и вся теория насмарку пойдет. А в наших обозначениях, что tf_max (что было раньше), что СУММА двух ТФ-истых - все едино: коэффициент пропорциональности в модели релевантной функции. Зачем вводить хренотень, жить которой возможно неделя? А коэффициент пропорциональности никогда не умрет :)
Не на tf, так на число слов в документе и ссылках или еще какая зараза...
А на следующее утро Яндекс изменит алгоритм. Увы, я не мазохист. Время, последняя ценность, что у меня осталась :(
Оформлять в виде статьи разумно нетленные вещи, все остальное суета сует.
pro-maker, вы лазерщик ведь? Лазер - квантовый генератор. Представьте, как на пальцах изложить квантовую теорию для людей с нынешним высшим образованием? Чтобы еще и коэффициент усиления они научились считать и открытые оптические резонаторы рассчитывать для ограниченных волновых пучков? :(