Вернуться   Форум об интернет-маркетинге > >
Закрытая тема
 
Опции темы
Старый 11.11.2006, 09:47   #1
Lovelace
 
Аватар для ХренРедькиНеСлаще
 
Регистрация: 27.07.2006
Адрес: Шалаш
Сообщений: 957
Репутация: 7975

По умолчанию Релевантность контента страниц запросу для Яндекса Эксперимент по Минычу

Сейчас еще раз проверяю как Яндекс ранжирует страницы по контенту. Думаю многим интересны будут результаты. Поэтому выкладываю.

Опыт номер 1.

На бесплатном хостинге два одностраничных сайта. Ссылок на эти сайты не существует ни внутренних, ни внешних. Поэтому ВИЦ можно считать одинаковым.

Каждый сайт содержит один и тот же набор слов (около 300), которые встречаются по одному разу (но перемешаны в случайном порядке) плюс на первом сайте одно слово встречается два раза, на другом другое слово встречается три раза.

Подается запрос Яндексу:
( слово1::вес1 | слово2::вес2)

Вначале фиксируется вес1 и меняем вес2. Находим такой вес2ступ, что для всех вес2<=вес2ступ первой выдается страница со словом слово1, а для всех вес2>вес2ступ первой выдается страница со словом слово2.

Затем эта процедура повторяется, но уже фиксируется вес2 на найденном значении вес2ступ и находится такая же грань для вес1: вес1ступ

Затем опять фиксируется уже вес1 на найденном вес1ступ и меняется вес2....

Эти процедуры позволяют нам измерить величины ступенек Миныча....

Первым делом испытаем на тех словах (1 и 2), которые на данных страницах встречаются по одному разу.

На скриншоте результаты измерений:

Видим что величины ступенек Миныча одинаковы, если брать формулу от веса sqrt(ln(весNступ+0.5))

Так как на страницах нет слов, число которых превышает 7, то тошноты страниц одинаковы.

Релевантность можно определить формулой:

Релевантность ~ sqrt(ln(вес)) (плюс "округление" до величины кратной целому числу из-за ступенек Миныча)

Красным цветом - это не грань ступеньки, а начальный вес (надо же начинать с какого-то веса весь эксперимент).
Изображения
 
ХренРедькиНеСлаще вне форума  

Реклама
Старый 11.11.2006, 10:09   #2
ХренРедькиНеСлаще
Lovelace
 
Аватар для ХренРедькиНеСлаще
 
Регистрация: 27.07.2006
Адрес: Шалаш
Сообщений: 957
Репутация: 7975

ТопикСтартер Re: Релевантность контента страниц запросу для Яндекса Эксперимент по Минычу

Опыт номер два.

Опять два одностраничных сайта с теми же словами однословками случайным образом перемешанных. Но на одном уже 30 слово1, на другом 40 слово2

Повторяем ту же процедуру что и в первом посте.

Изменения: изменились положения ступенек и их величина.

Причем с точностью до 9-го знака величины ступенек стали:

для страницы с 30 словами:

ступенька30=sqrt(30/7)*ступенька7

для страницы с 40 словами:

ступенька40=sqrt(40/7)*ступенька7

Ступенька7 это ступенька для страниц, с самым частым словом не более 7.

Релевантность ~ sqrt(ln(вес слова))/sqrt(tf_max)

По Минычу sqrt(tf_max) это тошнота, для страницы с 30 словами (самое частотное слово) tf_max равно 30, с 40 словами (самое частотное слово) tf_max равно 40.
Изображения
 
ХренРедькиНеСлаще вне форума  
Старый 11.11.2006, 13:13   #3
Romario
Аспирант
 
Регистрация: 17.07.2006
Сообщений: 103
Репутация: -595

По умолчанию Re: Релевантность контента страниц запросу для Яндекса Эксперимент по Минычу

пробовали ли вы не 300, а 600 слов например, не отодвигалась ли тошнота с 7 к скажем 10 словам?
и правильно ли надо понимать - превысил 7 слов - сразу в 3 раза веса потерял?
Romario вне форума  
Старый 11.11.2006, 13:20   #4
Каширин
Константин
 
Аватар для Каширин
 
Регистрация: 03.01.2004
Сообщений: 15,751
Репутация: 1664818

По умолчанию Re: Релевантность контента страниц запросу для Яндекса Эксперимент по Минычу

ХренРедькиНеСлаще, какие выводы из опытов?
__________________
Умеешь программировать, знаешь English? Пиши в личку - есть работа
Каширин на форуме  
Старый 11.11.2006, 17:22   #5
ХренРедькиНеСлаще
Lovelace
 
Аватар для ХренРедькиНеСлаще
 
Регистрация: 27.07.2006
Адрес: Шалаш
Сообщений: 957
Репутация: 7975

ТопикСтартер Re: Релевантность контента страниц запросу для Яндекса Эксперимент по Минычу

Цитата:
Сообщение от Romario
пробовали ли вы не 300, а 600 слов например, не отодвигалась ли тошнота с 7 к скажем 10 словам?
и правильно ли надо понимать - превысил 7 слов - сразу в 3 раза веса потерял?
Пробовали на случайных страницах в интернете (но выбирали так, чтобы ВИЦ был минимальным). Пока все укладывается в схему: самое частотное слово определяет тошноту однозначно. Единственная сложность: учет лемматизации (насчет лемматизации здесь: http://romip.narod.ru/romip2006/03_yandex.pdf), т.е. учет всех словоформ одного слова, приходится ручками лемматизировать.

Превысил 7 слов, допустим самое частотное слово на странице встретилось N раз , тошнота стала равной sqrt(N/7). Подтвеждается с точностью до 10 знака.
Цитата:
Сообщение от Каширин
ХренРедькиНеСлаще, какие выводы из опытов?
Тошнота рулит для всех ВИЦев и вклад ее не меньше чем ВИЦ (Хотя это две стороны медали, один множитель ВИЦ, а тошнота - делитель.
Второе плотность ключевика на странице для большого Яндекса - это МИФОЛОГИЯ (на сегодня)..
ХренРедькиНеСлаще вне форума  
Старый 11.11.2006, 17:38   #6
Разработчик
В поиске есть всё
 
Регистрация: 23.05.2006
Адрес: Санкт-Петербург
Сообщений: 4,973
Репутация: 77044
Отправить сообщение для Разработчик с помощью ICQ

По умолчанию Re: Релевантность контента страниц запросу для Яндекса Эксперимент по Минычу

Цитата:
Сообщение от ХренРедькиНеСлаще
Второе плотность ключевика на странице для большого Яндекса - это МИФОЛОГИЯ (на сегодня)..
Хороша мифология, если больше 7 слов на странице, то релевантность запросу снижается, я правильно понял?
Разработчик вне форума  
Старый 11.11.2006, 19:55   #7
ХренРедькиНеСлаще
Lovelace
 
Аватар для ХренРедькиНеСлаще
 
Регистрация: 27.07.2006
Адрес: Шалаш
Сообщений: 957
Репутация: 7975

ТопикСтартер Re: Релевантность контента страниц запросу для Яндекса Эксперимент по Минычу

Цитата:
Сообщение от Разработчик
Хороша мифология, если больше 7 слов на странице, то релевантность запросу снижается, я правильно понял?
Неправильно поняли (вроде бы).

На странице может быть и 100 и 1000 и 5000 слов, но тошнота зависит (и релевантносмть соответственно) не от общего числа слов на странице!!!!! А от числа самого частотного слова на странице. А это число никак не связано с общим числом слов на странице!.
ХренРедькиНеСлаще вне форума  
Старый 11.11.2006, 20:00   #8
Tarry
¯\_(ツ)_/¯
 
Аватар для Tarry
 
Регистрация: 31.10.2005
Адрес: Москва
Сообщений: 5,372
Репутация: 860811

По умолчанию Re: Релевантность контента страниц запросу для Яндекса Эксперимент по Минычу

Цитата:
Сообщение от ХренРедькиНеСлаще
Неправильно поняли (вроде бы).

На странице может быть и 100 и 1000 и 5000 слов, но тошнота зависит (и релевантносмть соответственно) не от общего числа слов на странице!!!!! А от числа самого частотного слова на странице. А это число никак не связано с общим числом слов на странице!.
То бишь есть текст из 5000 знаков. Предположим, что в нем встречаются слова: "жопа", "валенки", "акваланг", "газоэлектрофикация". При этом все эти слова встречаются одинаковое количество раз... Продолжите мысль? ...
Tarry вне форума  
Старый 11.11.2006, 20:03   #9
Разработчик
В поиске есть всё
 
Регистрация: 23.05.2006
Адрес: Санкт-Петербург
Сообщений: 4,973
Репутация: 77044
Отправить сообщение для Разработчик с помощью ICQ

По умолчанию Re: Релевантность контента страниц запросу для Яндекса Эксперимент по Минычу

Цитата:
Сообщение от ХренРедькиНеСлаще
Неправильно поняли (вроде бы).

На странице может быть и 100 и 1000 и 5000 слов, но тошнота зависит (и релевантносмть соответственно) не от общего числа слов на странице!!!!! А от числа самого частотного слова на странице. А это число никак не связано с общим числом слов на странице!.
Значит я правильно понял (всё-таки)
Но почему именно "семь"? Разве адекватна подобная привязка к количеству?
Разработчик вне форума  
Старый 11.11.2006, 20:27   #10
MiRaj
Академик
 
Аватар для MiRaj
 
Регистрация: 03.07.2006
Адрес: UK
Сообщений: 8,442
Репутация: 924137

По умолчанию Re: Релевантность контента страниц запросу для Яндекса Эксперимент по Минычу

Разработчик, 7-ка получена экспериментально.
Посмотрите предыдущие темы ХРНС, там все описано.
Правда в моих экспериментах получилось 8+-2 - выборка маловата
MiRaj вне форума  
Закрытая тема



Опции темы

Быстрый переход


Регистрация Справка Календарь Поддержка Все разделы прочитаны