Напишите в файлике, откуда берутся J K L M - Общие вопросы оптимизации

Эксперименты по ссылочному ранжированию Яндекса Результаты Яндекс растолкованный

ХренРедькиНеСлаще · 2026-07-01T11:07:38.0000000Z

Эксперименты по ссылочному ранжированию Яндекса Некоторые результаты С одобрения руководства выкладываю результаты некоторых экспериментов по ссылочному ранжированию, которые провел только что. Для сравнения были выбраны две страницы (прошу ссылки на них не ставить): http://hghltd.yandex.com/yandbtm?url=http%3A%2F%2Fsrcc.msu.su%2Fnum-meth%2Fzhurnal%2Ftom_2003%2Fv4r203.html&text=%C2%FB%F7%E8%F1%EB%E8%F2%E5%EB%FC%ED%FB%E9%20%EF%EE%EB%E8%E3%EE%ED%20%EF%F0%E5%E4%EE%F1%F2%E0%E2%EB%FF%E5%F2%20%F1%F0%E5%E4%F1%F2%E2%E0%20%E4%EB%FF%20%EE%EF%E5%F0%E0%F2%E8%E2%ED%EE%E3%EE%20%E4%EE%F1%F2%F3%EF%E0&reqtext=(%C2%FB%F7%E8%F1%EB%E8%F2%E5%EB%FC%ED%FB%E9%3A%3A99547%20%26%20%EF%EE%EB%E8%E3%EE%ED%3A%3A136617%20%26%26%2F(-7%207)%20%EF%F0%E5%E4%EE%F1%F2%E0%E2%EB%FF%E5%F2%3A%3A8134%20%26%26%2F(-7%207)%20%F1%F0%E5%E4%F1%F2%E2%E0%3A%3A2842%20%26%2F(-1%203)%20%E4%EB%FF%3A%3A0%20%26%20%EE%EF%E5%F0%E0%F2%E8%E2%ED%EE%E3%EE%3A%3A21750%20%26%20%E4%EE%F1%F2%F3%EF%E0%3A%3A7883)%2F%2F6&dsn=365&d=504790&sh=1&sg=6&isu=1 http://www.yandex.ru/yandsearch?text=corba%3C%3Curl%3D%22srcc.msu.su%2Fnum-meth%2Fzhurnal%2Ftom_2003%2Fv4r202.html%22&stype=www На эти страницы ведут фактически эквивалентные ссылки со словами "v4r202" и "v4r203" Составим запрос: (v4r202 | v4r203) и подадим Яндексу: http://www.yandex.ru/yandsearch?text=(v4r202%20%7C%20v4r203)&pag=u&surl=msu.su& Видим, что первой выдается стр v4r202. Насколько она опережает v4r203 и почему? Анализ ссылок говорит, что с данными словами ссылки только на: http://www.yandex.ru/yandsearch?ras=1&date=&text=%28v4r202+%7C+v4r203%29&spcctx=notfar&zone=anchor&linkto=&wordforms=all&lang=all&within=0&from_day=&from_month=&from_year=&to_day=16&to_month=11&to_year=2006&mime=all&Link=&rstr=&site=&numdoc=50&ds=&rd=0 Еще один факт, ссылок больше на страницу v4r203 http://www.yandex.ru/yandsearch?text=link%3D%22www.srcc.msu.su%2Fnum-meth%2Fzhurnal%2Ftom_2003%2Fv4r203.html%22&stype=www&rd=0 http://www.yandex.ru/yandsearch?text=link%3D%22www.srcc.msu.su%2Fnum-meth%2Fzhurnal%2Ftom_2003%2Fv4r202.html%22&stype=www&rd=0 Правда, v4r202 меньше по контенту (страница с меньшим числом слов), но так как тошноты там одинаковы, то это не должно, вроде, влиять. Результаты в файлике Ексель (см ниже). В нем же данные эксперимента по контенту и ВИЦу этих страниц. Опять же, для большинства любителей прогонять по каталогам странным будет факт, что ВИЦ страницы v4r203 также выше, но в выдаче почему-то первой v4r202 :) Подробное обсуждение результата будет позднее, когда тот кто заинтересован понять что и как и почему разберется в файлике и подумает. Кратко поясню пока: Данные со строки 5 по 75 это по ссылочному. Со строки 77 по 104 это по контенту и ВИЦ. Пояснения: это тестовый запрос для ссылочного (после :: варьируемые веса слов) ((v4r202::2099321)<<url="srcc.msu.su/num-meth/zhurnal/tom_2003/v4r202 .html") | ((v4r203::1882621951)<<url="srcc.msu.su/num- meth/zhurnal/tom_2003/v4r203.html") это тестовый запрос для контента и ВИЦ (после :: варьируемые веса слов) ((инкапсуляции::218467634)<<url="srcc.msu.su/num- meth/zhurnal/tom_2003/v4r202.html") | ((сравнения::44236800) << url="srcc.msu.su/num- meth/zhurnal/tom_2003/v4r203.html") Столбцы B D (различаются на единицу веса слова) задают экспериментально определенный уровень ступеньки Миныча. Пример для ссылочного: первая строка, столбцы: b=2269588 (находится в результате эксперимента) d=2269589 (находится в результате эксперимента) f=2147483647 (задается в эксперименте) h=srcc.msu.su/num-meth/zhurnal/tom_2003/v4r203.html (задается в эксперименте) означает, что для страницы h=srcc.msu.su/num-meth/zhurnal/tom_2003/v4r203.html вес слова v4r203 фиксируется на уровне f=2147483647 и для всех весов хххххх больших или равных d=2269589 для слова v4r202 страница v4r202 будет выдаваться первой в запросе: ((v4r202::хххххх)<<url="srcc.msu.su/num-meth/zhurnal/tom_2003/v4r202 .html") | ((v4r203::2147483647)<<url="srcc.msu.su/num- meth/zhurnal/tom_2003/v4r203.html") например: ((v4r202::2269589)<<url="srcc.msu.su/num-meth/zhurnal/tom_2003/v4r202.html") | ((v4r203::2147483647)<<url="srcc.msu.su/num-meth/zhurnal/tom_2003/v4r203.html") первой будет выдана страница v4r202, а при уменьшении веса на единичку и запросе: ((v4r202::2269588)<<url="srcc.msu.su/num-meth/zhurnal/tom_2003/v4r202.html") | ((v4r203::2147483647)<<url="srcc.msu.su/num-meth/zhurnal/tom_2003/v4r203.html") первой будет выдана страница v4r203. Этот механизм действует для любой строки, приведенной в файле Ексель. Подробней можно будет обсудить далее. Почеркну следующие моменты: 1. Имеются ступеньки Миныча как по контенту, так и ссылочному. 2. Так как тошноты двух страниц минимальные (самое частотное слово меньше 7 на обоих страницах), то тошноты ОДИНАКОВЫЕ, шаг ступеньки Миныча для контента равен 0,020669932 3. Шаги для контента идут с дискретностью по sqrt(ln(вес грани ступеньки) 0,020669932 4. Шаги для ссылочного идут с дискретностью ln(вес грани ступеньки) (зависит от страницы, так как тошноты неодинаковы для ссылочного) 5. Точность измерений может быть до 10 знака. 6. ВИЦЫ страниц различаются мало, в нашем случае как 216/224 7. Первой по ссылочному выдается страница, где ВИЦ ниже, а общее число ссылок на нее меньше. Все устал писать. Кто захочет разобраться все данные есть в файле, ничего не утаено, все открыто и можно проверить с точностью до миллиметра. Теперь буду отвечать на вопросы. если будут. Если кто давно в теме, может додуматься, что ничего потайного в Яндексе вроде нет :) Ну или почти нет :) Так что не следует торопиться бездумно региться в каталогах, ребятки :) Алявидерчи....

57

ХренРедькиНеСлаще

28 ноября 2006, 09:26

#141

pro-maker:
Хрнс, я с уважением отношусь к Вам

Искренне, спасибо.

pro-maker:
в первом посте топика в Excel-файле в J-ячейках формула LN(B7+0.5), откуда берете "0.5", который складываете в логарифме с весом?

0,5 это за счет того, что я нашел интервал, размером в 1, ВНУТРИ которого реально проходит грань.

Скажем при весе в 10, первой идет страница 202, при весе 11 первой идет страница 203. Наиболее вероятное значение величины ступеньки это (10+11)/2, что я записываю как 10+0,5

Дайте мне рюмку опоры и мир засветится всеми цветами радуги.

281

pro-maker

28 ноября 2006, 09:54

#142

ХренРедькиНеСлаще:
Скажем при весе в 10, первой идет страница 202, при весе 11 первой идет страница 203. Наиболее вероятное значение величины ступеньки это (10+11)/2, что я записываю как 10+0,5

А что в M,S-ячейках? Что за величину дает отношение линеаризованного веса (с использованием корня из натурального логарифма веса) к разнице линеаризованных весов соседних ступенек? И как эти M,S-ячейки связаны с релевантностью, например, описанной Вами для текста как:

Р = (число вхождений ключевика) * sqrt(ln(вес)) / sqrt(число вхождений самого частого слова)

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

57

ХренРедькиНеСлаще

28 ноября 2006, 10:25

#143

pro-maker:
А что в M,S-ячейках? Что за величину дает отношение линеаризованного веса (с использованием корня из натурального логарифма веса) к разнице линеаризованных весов соседних ступенек?

M,S столбцы это чисто вычислительные, они дают возможность следить за тем идут ли ступеньки регулярно и позволяют сравнивать размеры ступенек для разных запросов и разных страниц (для наглядности). То, что при делении они при больших весах дают целые числа (можно считать число ступенек, если ступеньки идут друг за другом а не через 2-3-4-5 и тд.) весьма показательно. Время от времени там идут сбои (прогнозируемые, так как ВИЦы разные и наклон "лестниц" разный, он не может точно совпадать с отношением ширины ступени к ее высоте), целые числа сразу впечатляют. А когда отношение тошнот (ширины и высоты ступенек) оказывается частным от деления двух целых чисел, это тоже производит впечатление, когда вдруг ты догадываешься, что это за целые числа :)

pro-maker:
Р = (число вхождений ключевика) * sqrt(ln(вес)) / sqrt(число вхождений самого частого слова)

Будем считать, что эту формулу (она была РАНЬШЕ в алгоритме), мы и проверяем сейчас.

Она отражала, например, антиспамовый коэффициент и модификацию tf степенной функцией со степенью меньшей 1 (а фактически степенью 1/2, как сейчас Вы могли видеть из файликов которые выложены) из работы Маслова, которую уже приводил Wolf: http://www.romip.narod.ru/romip2003/6_yandex-romip.pdf

Возьмите эту формулу для ключевика-самого частого слова, получится корень квадратный из этого самого частого числа: tf^0,5

D

173

dweller

28 ноября 2006, 10:30

#144

pro-maker:
Ваши посты очень содержательны, но времени приходится тратить на их разбор просто неадекватно много

Угу. Чтобы понять алгоритмы яндекса лучше изучать катрены Нострадамуса, где эти алгоритмы описаны более полно. Да и времени затратите меньше, чем на посты Хрнс.

A

26

amonasro

28 ноября 2006, 11:41

#145

Уважаемый ХРНС!

Премногое спасибо вам за ваши эксперименты – действительно очень полезно. Внимательно и с интересом читаю все ваши темы. Однако, как заметили старшие товарищи, действительно слишком много зашифрованных данных, которые приходится расшифровывать самому, что отнимает очень много времени.

Если вы намеренно ограничиваете информацию, допустим, чтобы ваши расчеты смог понять очень узкий круг посвященных, или по другим очевидным причинам, так и скажите – ребята, я не могу показать вам все, верьте мне на слово. Но ведь вы приглашаете к диалогу – «тот кто заинтересован понять что и как и почему разберется в файлике и подумает».

Я честно пытаюсь разобраться что к чему уже почти неделю – начальство в отпуске, появилось время – и не могу. Не могу по причине нехватки данных. Поэтому задаю законный вопрос – а почему вы не озаглавите столбцы? Почему бы вам не написать, что J=ln(b + 0,5), что K=sqrt(J), что L= K(i) – K(i+1), и т.д. ? Вы много пишете на форуме, думаю описать более-менее подробно суть эксперимента для вас не составит большого труда.

Если же вы подбрасываете нам головоломки намеренно – я бы сам не стал выкладывать на блюдечке для всех результаты эксперимента, над которым корпел неделю или больше – так и скажите – этот файл для любителей поломать голову, предупреждаю ребята.

Теперь конкретные вопросы. Объясните пожалуйста, по какому принципу вы отбираете числа (веса слов - @@@ и ###), т.е. колонку f – для своих запросов? Я не могу понять логики, но ведь не с потолка же вы их берете.

Мне кажется логично было бы сделать так – (для запроса слово1::вес1 | слово2::вес2) – стартуем с одинаковых весов, например с минимума - с единицы, начинаем повышать вес слова с менее релевантной страницы – допустим вес2, находим пороговое значение смены выдачи – фиксируем вес2 и начинаем уже увеличивать вес1, пока выдача опять не изменится, и т.д… до максимума.

У вас же явно по другому – как? И пожалуйста, напишите в файлике , откуда берутся J K L M … чтобы вас не спрашивали в топике «а что такое L» - если это конечно возможно.

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

57

ХренРедькиНеСлаще

28 ноября 2006, 12:40

#146

amonasro:
Вы много пишете на форуме, думаю описать более-менее подробно суть эксперимента для вас не составит большого труда.

ВЫ неправы. Это тоже труд, причем наиболее время-затратный. А Вы знаете такую фразу: "нехватка времени"?

amonasro:
Теперь конкретные вопросы. Объясните пожалуйста, по какому принципу вы отбираете числа (веса слов - @@@ и ###), т.е. колонку f – для своих запросов? Я не могу понять логики, но ведь не с потолка же вы их берете.

Мне кажется логично было бы сделать так – (для запроса слово1::вес1 | слово2::вес2) – стартуем с одинаковых весов, например с минимума - с единицы, начинаем повышать вес слова с менее релевантной страницы – допустим вес2, находим пороговое значение смены выдачи – фиксируем вес2 и начинаем уже увеличивать вес1, пока выдача опять не изменится, и т.д… до максимума.

Да, стартуем с одинаковых весов, только с самого максимального целого числа. И начираем уменьшать. :)

amonasro:
ткуда берутся J K L M … чтобы вас не спрашивали в топике «а что такое L» - если это конечно возможно.

jklm это формулы экселя , взятые от весов, найденных в эксперименте. Почему именно такие? Считайте, что мне так показалось удобным.

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

[Удален]

28 ноября 2006, 12:48

#147

ХренРедькиНеСлаще, вот обьясните мне, плиз, и что с этого всего ? Что функция монотонно возрастающая, это, как уже говорил вольф, и так понятно. Дальше то что ? А так это опиум для народа...

57

ХренРедькиНеСлаще

28 ноября 2006, 13:29

#148

Miha Kuzmin (KMY):
ХренРедькиНеСлаще, вот обьясните мне, плиз, и что с этого всего ? Что функция монотонно возрастающая, это, как уже говорил вольф, и так понятно. Дальше то что ? А так это опиум для народа...

Первая опция опия для народа бесплатно :)

Кстати, а я только еще в начале пути :)

ВИЦы, доноры и больные, длина ссылок, число ссылок, оптимизация ссылок, "склейка" (гы-гы), разные тексты ссылок, одинаковые тексты, асимптотическое поведение линкатороподобных систем...

Впереди еще много серой работы для серых наших мышей. Или это уже никого не интересует, потому что Яндексоиды давно все это уже разжевали и раскрыли и всё давно всем известно??

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

1183

wolf

28 ноября 2006, 13:33

#149

ХренРедькиНеСлаще:
Первая опция опия для народа бесплатно

Насколько я понимаю, ради второй опции (платной) всё и затевается. Чтобы пришел клиент, дал денег, сказал: "померяйте мне ВИЦ", получил ответ: "38 попугаев и одна ступенька Миныча, пардон, попугайское крылышко" и счастливый ушел восвояси. ;)

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол UXUkraine 2011: доклад Дэйва

ПА

6

Подкович Антон

28 ноября 2006, 13:34

#150

ХренРедькиНеСлаще, всем интерестно, продолжайте.

Вышел новый Яндекс Браузер с YandexGPT и YandexART

Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы

Эксперименты по ссылочному ранжированию Яндекса Результаты Яндекс растолкованный