ХренРедькиНеСлаще

ХренРедькиНеСлаще
Рейтинг
57
Регистрация
27.07.2006
Должность
Безработный, если кто даст подработать подкинет, милости прошу к своему шалашу... Девушкам особое почтение! :)
Интересы
Вино и бабы :) Короче, Любовь!
Любитель редьки и огурца
wolf:
Насколько я понимаю, ради второй опции (платной) всё и затевается. Чтобы пришел клиент, дал денег, сказал: "померяйте мне ВИЦ", получил ответ: "38 попугаев и одна ступенька Миныча, пардон, попугайское крылышко" и счастливый ушел восвояси.

Это уже пройденный этап. Вторая порция опия тоже будет бесплатно! :)

Кстати, wolf? f если мы не так будем кукарекать, а несколько по другому:

У Вас стоит две сссылки по сто баксов и третья за 50. Так вот дорогой клиент, эта третья в два раза эффективнее первых двух (т.е. только четырьмя такими первыми Вы сможете перебить последнюю третью.

И потом есть еще масса возможностей. Кстати, wolf, Вы поняли, почему Вы в мерянии ВИЦА проигрываете? И почему морда Вашего Текарта могла бы в два раза примерно эффективнее быть по Вашим любимым запросам, причем просто по мановению волшебной палочки??

Miha Kuzmin (KMY):
ХренРедькиНеСлаще, вот обьясните мне, плиз, и что с этого всего ? Что функция монотонно возрастающая, это, как уже говорил вольф, и так понятно. Дальше то что ? А так это опиум для народа...

А что от меня то надо? Чтобы я сделал не монотонную или понижающую?

Miha Kuzmin (KMY):
ХренРедькиНеСлаще, вот обьясните мне, плиз, и что с этого всего ? Что функция монотонно возрастающая, это, как уже говорил вольф, и так понятно. Дальше то что ? А так это опиум для народа...

Первая опция опия для народа бесплатно :)

Кстати, а я только еще в начале пути :)

ВИЦы, доноры и больные, длина ссылок, число ссылок, оптимизация ссылок, "склейка" (гы-гы), разные тексты ссылок, одинаковые тексты, асимптотическое поведение линкатороподобных систем...

Впереди еще много серой работы для серых наших мышей. Или это уже никого не интересует, потому что Яндексоиды давно все это уже разжевали и раскрыли и всё давно всем известно??

wolf:
Более того, практически всё, о чем сейчас говорят изыскатели, можно найти в трудах самих работников Яндекса. Надо только уметь искать и вдумчиво читать найденное. Ну, и понятное дело, яндексоиды называют всё другими терминами.

Э, да лед тронулся, граждане-заседатели.

Все в полном соответствии с теорией развития любой научной доктрины: три стадии.

1-я стадия: что за чушь? Что за бред?

2-я стадия: в этом что-то есть....

3-я стадия: да тут и ежу десять лет назад было понятно! Изобрели велосипед. Да сами сотрудники Яндекса все давно разжевали и разъяснили 😂 😂 😂

Похоже, 3-я стадия уже назрела. :D :D :D

amonasro:
Вы много пишете на форуме, думаю описать более-менее подробно суть эксперимента для вас не составит большого труда.

ВЫ неправы. Это тоже труд, причем наиболее время-затратный. А Вы знаете такую фразу: "нехватка времени"?

amonasro:
Теперь конкретные вопросы. Объясните пожалуйста, по какому принципу вы отбираете числа (веса слов - @@@ и ###), т.е. колонку f – для своих запросов? Я не могу понять логики, но ведь не с потолка же вы их берете.

Мне кажется логично было бы сделать так – (для запроса слово1::вес1 | слово2::вес2) – стартуем с одинаковых весов, например с минимума - с единицы, начинаем повышать вес слова с менее релевантной страницы – допустим вес2, находим пороговое значение смены выдачи – фиксируем вес2 и начинаем уже увеличивать вес1, пока выдача опять не изменится, и т.д… до максимума.
Да, стартуем с одинаковых весов, только с самого максимального целого числа. И начираем уменьшать. :)
amonasro:
ткуда берутся J K L M … чтобы вас не спрашивали в топике «а что такое L» - если это конечно возможно.

jklm это формулы экселя , взятые от весов, найденных в эксперименте. Почему именно такие? Считайте, что мне так показалось удобным.

pro-maker:
А что в M,S-ячейках? Что за величину дает отношение линеаризованного веса (с использованием корня из натурального логарифма веса) к разнице линеаризованных весов соседних ступенек?

M,S столбцы это чисто вычислительные, они дают возможность следить за тем идут ли ступеньки регулярно и позволяют сравнивать размеры ступенек для разных запросов и разных страниц (для наглядности). То, что при делении они при больших весах дают целые числа (можно считать число ступенек, если ступеньки идут друг за другом а не через 2-3-4-5 и тд.) весьма показательно. Время от времени там идут сбои (прогнозируемые, так как ВИЦы разные и наклон "лестниц" разный, он не может точно совпадать с отношением ширины ступени к ее высоте), целые числа сразу впечатляют. А когда отношение тошнот (ширины и высоты ступенек) оказывается частным от деления двух целых чисел, это тоже производит впечатление, когда вдруг ты догадываешься, что это за целые числа :)

pro-maker:
Р = (число вхождений ключевика) * sqrt(ln(вес)) / sqrt(число вхождений самого частого слова)

Будем считать, что эту формулу (она была РАНЬШЕ в алгоритме), мы и проверяем сейчас.

Она отражала, например, антиспамовый коэффициент и модификацию tf степенной функцией со степенью меньшей 1 (а фактически степенью 1/2, как сейчас Вы могли видеть из файликов которые выложены) из работы Маслова, которую уже приводил Wolf: http://www.romip.narod.ru/romip2003/6_yandex-romip.pdf

Возьмите эту формулу для ключевика-самого частого слова, получится корень квадратный из этого самого частого числа: tf^0,5

pro-maker:
Хрнс, я с уважением отношусь к Вам

Искренне, спасибо.

pro-maker:
в первом посте топика в Excel-файле в J-ячейках формула LN(B7+0.5), откуда берете "0.5", который складываете в логарифме с весом?

0,5 это за счет того, что я нашел интервал, размером в 1, ВНУТРИ которого реально проходит грань.

Скажем при весе в 10, первой идет страница 202, при весе 11 первой идет страница 203. Наиболее вероятное значение величины ступеньки это (10+11)/2, что я записываю как 10+0,5

wolf:
Сообщение от Перец
А в чем разница - в три часа ночи семонитором закешируется выдача или в девять утра руками пользователя?
В три часа ночи она кривее

Вот я об этом и думаю. А еще думаю, что этим могут вредители воспользоваться. Заколбасить конкурирующей сео конторе ее запросы в самый кривой пик и пусть они следующие три дня над косяками своими думают и время теряют.

Свою тематику само собой не трогаю. Если гдето разгорелся трудовой процесс на косяками, то над нужным мне домом будет спокойнее (закон Ломоносова, если в одном месте что то убудет, в другом присовокупится).

wolf:
В первый раз вижу математика, который называет себя гуманитарием. Вообще-то, математика не гуманитарная, а естественнонаучная специальность.

Всегда считал и сейчас считаю, что это гуманитарная профессия. Неужели Бурбаки, это технари?

wolf, А если Яндексу наплевать на наши определения?

Представьте, я меряю, получаю набор чисел. И что мне с ним делать? Понять гармонию и предложить функцию, которая лучшим образом аппроксимирует этот набор чисел и позволяет предсказывать ситуации, не входящие в полученный набор чисел.

Аналогия: Вы предлагаете мне использовать ряд Тейлора. А я почему то хочу ряд Фурье, в том числе и потому, что в рядах Тейлора ничего не понимаю.

И еще. Не хочу я таких определений, которые сами же и заводят в ловушку.

Вот почему тошнота, а не tf_max? Да потому, что завтра Яндекс возьмет и будет tf делить на сумму ДВУХ самых tf-истых слова и вся теория насмарку пойдет. А в наших обозначениях, что tf_max (что было раньше), что СУММА двух ТФ-истых - все едино: коэффициент пропорциональности в модели релевантной функции. Зачем вводить хренотень, жить которой возможно неделя? А коэффициент пропорциональности никогда не умрет :)

Не на tf, так на число слов в документе и ссылках или еще какая зараза...

pro-maker:
Хрнс, лучше изложить все в одной статье, определив терминологию, изложив логику, объяснив происхождение составляющих и описав все понятным языком.

А на следующее утро Яндекс изменит алгоритм. Увы, я не мазохист. Время, последняя ценность, что у меня осталась :(

Оформлять в виде статьи разумно нетленные вещи, все остальное суета сует.

pro-maker:
Вы же излагаете в таком стиле, что иногда складывается впечатление, что специально запутываете и усложняете в целях пиара услуг школы Миныча.
А чем плох пиар? Даже если так. Кто МОЖЕТ, пожалуйста, разве трудно свою тему открыть и изложить все идеально и по полочкам? Я сделал, что мог и что мог себе позволить.

pro-maker, вы лазерщик ведь? Лазер - квантовый генератор. Представьте, как на пальцах изложить квантовую теорию для людей с нынешним высшим образованием? Чтобы еще и коэффициент усиления они научились считать и открытые оптические резонаторы рассчитывать для ограниченных волновых пучков? :(

Всего: 982