Экспериментальные данные о "новом" алгоритме Яндекса

wolf
На сайте с 13.03.2001
Offline
1183
#131
ХренРедькиНеСлаще:
Проигнорировал потому, что взял альтернативную формулировку методики Миныча (через величины ступенек). При этом ВИЦ не важен. Это фактически потому , что мы знаем связь в некоторых случаях между величиной ступени, тошнотой и величиной самого частотного слова.

Тогда для полной ясности (Вы ведь этого добиваетесь, не так ли?) неплохо было бы установить физический смысл "величины ступенек", в частности, почему ВИЦ тут не влияет, и заодно прогнать пример по прямой методике. ;)

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
ХренРедькиНеСлаще
На сайте с 27.07.2006
Offline
57
#132
wolf:
Тогда для полной ясности (Вы ведь этого добиваетесь, не так ли?) неплохо было бы установить физический смысл "величины ступенек", в частности, почему ВИЦ тут не влияет, и заодно прогнать пример по прямой методике.

Физический смысл надо спрашивать у Яндекса. Мы ведь не спрашиваем, почему Земля вокруг Солнца вертится, хотя с точки зрения Эйнштейна это все равно как считать, лишь бы результаты экспериментов с этим совпадали.

Так данные в файле это и есть прямая метода, просто надо эти данные иначе обсчитывать. не через ступени. Оставим это тем, кого это волнует.

Я бы не хотел слишком быстро раскрывать карты по измерению ВИЦ, поэтому воспользовался альтернативкой :)

Дайте мне рюмку опоры и мир засветится всеми цветами радуги.
wolf
На сайте с 13.03.2001
Offline
1183
#133
ХренРедькиНеСлаще:
Ввиду такого значительного изменения в тошноте (ее увеличения в большинстве случаев) Яндекс изменил коэффициенты пропорциональности между ссылочным фактором и фактором контента в сторону контента.

Таки не совсем понял, откуда следует вывод, что изменение произошло в сторону контента. Ведь ежели тошнота контентная в большинстве случаев увеличилась, то вес контента по отношению к запросам, а стало быть, и контентный вклад в релеватность, должен понизиться. Ведь его зависимость от тошноты, сиречь частотности самого частотного термина - обратная, а не прямая.

ХренРедькиНеСлаще
На сайте с 27.07.2006
Offline
57
#134
wolf:
Таки не совсем понял, откуда следует вывод, что изменение произошло в сторону контента. Ведь ежели тошнота контентная в большинстве случаев увеличилась, то вес контента по отношению к запросам, а стало быть, и контентный вклад в релеватность, должен понизиться. Ведь его зависимость от тошноты, сиречь частотности самого частотного термина - обратная, а не прямая.

Правильно. Но ведь Яндекс не идиот ломать сразу и всерьез асессорную работу, раз тошнота возросла процентов на 20 в среднем. то это надо учесть процентов на 20 увеличением коэффициента в контенте. Чтобы в среднем было все окей, а у оптимизаторов геморрой. :)

AiK
На сайте с 27.10.2000
Offline
257
AiK
#135
ХренРедькиНеСлаще:
Почему опять?

Потому что рыбнадзор. Сначала пишем, что

ХренРедькиНеСлаще:
Совпадение до 7-9 знака после запятой теоретических результатов с измеренными может убедить даже слона.

А потом выясняется:

ХренРедькиНеСлаще:
Скрипт мной написан давно для подсчета слов, он не идеален, более того иногда считает текст в тегах, что Яндексом не индексируется.

Т.е. либо придётся считать точно, либо забыть про совпадения до 7-го знака.

Я вот не поленился, посчитал две страницы, по которым делаются далекоидущие выводы. Нам почему-то предъявлено, что самое частотное слово - предлог "и" встречается ровно 14 раз (id=74). А я насчитал своей программулиной 33 раза и ручками перепроверил - опять 33 получилось. Самое интересное, что если проигнорировать предлоги, то самое часто встречающееся слово для первого документа имеет 23 повтора, а для второго -27. И как не дели одно на другое, "эксперементальные" данные не подтверждаются. По-моему это называется подтасовкой.

S
На сайте с 06.02.2006
Offline
85
#136
ХренРедькиНеСлаще:
Те страницы, где очень часто встречались предлоги и союзы типа "и", "в", "с" "для",...
при этом должны были упасть (по отношению с документами, где такие союзы были редки).

Мда, жестоко... имхо, литература и математика - несовместимые вещи!

С уважением, Хорев Андрей (http://www.khorev.net/)
nickspring
На сайте с 29.03.2006
Offline
228
#137
AiK:
встречается ровно 14 раз (id=74). А я насчитал своей программулиной 33 раза и ручками перепроверил - опять 33 получилось

не знаю о чем Вы, у меня там ровно 14 союзов "и".

AiK
На сайте с 27.10.2000
Offline
257
AiK
#138
nickspring:
не знаю о чем Вы, у меня там ровно 14 союзов "и".

Э... в документ 2003-го года залез. Каюсь, был невнимателен. Посыпаю голову пеплом, приношу извинения и проч. проч. Однако и в документе 2004-года союз и встречается 12 раз и ещё 3 раза буква И встречается в инициалах. Т.е. опять 14-ть у меня не выходит. Вроде бы на этот раз не ошибся, т.к. документ про SCILAB... Т.е. лично мне легче не стало...

ХренРедькиНеСлаще
На сайте с 27.07.2006
Offline
57
#139
AiK:
Э... в документ 2003-го года залез. Каюсь, был невнимателен. Посыпаю голову пеплом, приношу извинения и проч. проч. Однако и в документе 2004-года союз и встречается 12 раз и ещё 3 раза буква И встречается в инициалах. Т.е. опять 14-ть у меня не выходит. Вроде бы на этот раз не ошибся, т.к. документ про SCILAB... Т.е. лично мне легче не стало...

AiK, тут придется дважды посыпать :)

Мне тут файлик пришлось поправить по замечанию Саге, так что 73 меняйте на 74 и наоборот

/ru/forum/comment/1691626

у 73 дока букв "И" 14 штук

у 74 дока букв "и" 15 штук

:)

nickspring
На сайте с 29.03.2006
Offline
228
#140

ХренРедькиНеСлаще, а насколько верно считать инициалы с точкой союзом "и"? Я на http://vface.controlstyle.ru/ns.php не учитываю такие буквы. У меня там на 74-м документе ровно 12 штук "и" без инициалов.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий