Экспериментальные данные о "новом" алгоритме Яндекса

Nikolai Popkov
На сайте с 07.06.2001
Offline
210
#21
Anryk:
т.е. текстом не "для людей". Что, на мой взгляд, противоречит здравому смыслу

это самая первая мысль, которая возникает при прочтении

партнерские программы (http://www.ebanners.ru/viewforum.php?f=7), словарь термины SEO (http://www.ebanners.ru/viewtopic.php?t=548) Форум маркетинг (http://www.reclama.su/) Reclama.Su, обмен ссылками (http://www.ebanners.ru/viewforum.php?f=13), Reklama.SU: контекстная реклама (http://www.reklama.su/) по цене Яндекса+продвижение за результат
ХренРедькиНеСлаще
На сайте с 27.07.2006
Offline
57
#22
nickspring:
ХренРедькиНеСлаще, и что, объем страницы не учитывается? т.е. получается с очень большой вероятностью, что статья на 10000 знаков про попугаев будем менее релевантна, чем новость про этих же попугаев?

Это выяснил Миныч еще года полтора назад, что играет роль не объем текста, а самое частотное слово. Но ранее стоп слова в подсчет самого частотного слова не входили.

Это к вопросу об оптимальной плотности ключевика, которой нет. Если самое частотное слово входит менее 7 раз, то используется число семь в качестве числа самого частотного.

Дайте мне рюмку опоры и мир засветится всеми цветами радуги.
Boris Shramko
На сайте с 18.01.2006
Offline
116
#23

Ночь, улица, фонарь, аптека.

Вот где релеваетность зарыта...

308827355
ХренРедькиНеСлаще
На сайте с 27.07.2006
Offline
57
#24
Anryk:
Сейчас, получается так, Вы проводите эксперимент, пренебрегая какими-то параметрами, потому что ранее Вы уже выяснили на основе других экспериментов, что эти параметры влияют на выдачу таким-то образом, т.е. с большими допусками и в отрыве от времени,(алгоритм же меняется?) Что приводит к получению крайне интересных, но, возможно, неверных результатов и порождению новых "заблуждений", коих, тут я с Вами согласен, и так хватает.

Если Вы считаете, что три дня назад сделанные эксперименты, в том числе с использованием разных позиций слов, разных падежей, строчных и заглавных букв и т.п. это "хреновые" и "неверные" данные, то мне сказать Вам нечего. Поищите на форуме, может найдете философский камень :)

Megavolt
На сайте с 23.12.2005
Offline
179
#25

данные, кстати, стопудово "хреновые" :)

Иногда лучше жевать.... (С)
Vit@l
На сайте с 18.11.2005
Offline
57
#26

По-моему нельзя рассуждать о справедливости этой темы. Человек провел солидное исследование, хотя для меня и неожиданное, и простыми домыслами цифры не победить. Сейчас "почистил" текст на одном сайте, подожду АПа. Я пока сам не очень надеюсь на результат, но предлагаю всем спорщикам (кто хочет доказать свою точку зрения) почитсить тексты и встретиться через недельку в этом топике и огласить результаты. Так сказать проведем тот же эксперимент, но без цифр и массово.

Только одно замечание. За последний АП, а может и последние 2 (не уследил), мои морды в кэше Я не поменялись. Надо дождаться этого события.

A
На сайте с 29.03.2006
Offline
26
#27

Уважаемый ХРНС, позвольте в очередной раз поблагодарить вас за ваши опыты. И за то, что с каждым разом описание ваших экспериментов становится все более доступным для восприятия :)

Вопрос по сути. Другими словами, как я понял, вы утверждаете, что нормировка tf (тошноты) осуществляется по самому частотному слову в документе, и что теперь Яндексом стали учитываться стоп-слова.

Таким образом, если мы имеем две практически одинаковые страницы с общим количеством 300 слов, из них 10 слов - "ключевик", но на одной странице 20 союзов "и", а на другой их 16, то вторая страница будет более релевантна по запросу "ключевик".

И отношение релевантностей будет равно sqrt ((10/16) / (10/20)) ?

ХренРедькиНеСлаще
На сайте с 27.07.2006
Offline
57
#28
amonasro:
Вопрос по сути. Другими словами, как я понял, вы утверждаете, что нормировка tf (тошноты) осуществляется по самому частотному слову в документе, и что теперь Яндексом стали учитываться стоп-слова.

Таким образом, если мы имеем две практически одинаковые страницы с общим количеством 300 слов, из них 10 слов - "ключевик", но на одной странице 20 союзов "и", а на другой их 16, то вторая страница будет более релевантна по запросу "ключевик".

И отношение релевантностей будет равно sqrt ((10/16) / (10/20)) ?

Да, это так, если союз "и" самое частотное слово на обоих страницах и ВИЦы страниц одинаковы.

Можно еще заметить, что наиболее оптимален вариант, когда наш ключевик - самое частотное слово.

MiRaj
На сайте с 03.07.2006
Offline
509
#29
ХренРедькиНеСлаще:
Да, это так, если союз "и" самое частотное слово на обоих страницах и ВИЦы страниц одинаковы.

ХРНС, а как же title H1 и прочая лабуда ;)

Муркетолог. 100 пресс-релизов с прямыми ссылками за 150 баксов? Легко! (http://b2blogger.com) Статейный маркетинг - лучшее лекарство от Минусинска! (http://miralinks.ru)
A
На сайте с 29.03.2006
Offline
26
#30
Да, это так, если союз "и" самое частотное слово на обоих страницах и ВИЦы страниц одинаковы.

Да, это подразумевалось.

Попробовал воспроизвести ваш эксперимент. Все сходится. Точность до 9 знака впечатляет. Осталось еще раз осмыслить полученные данные, и доказать теорию практикой. :)

Правда иногда при смене весов в результатах поиска выдаются не обе страницы, а только одна из них - у вас тоже так бывает?

И что вы думаете про двухсловные запросы? Тошноты ключевиков должны быть завязаны на отношение корней ln весов слов?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий