- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Зачем быть уникальным в мире, где все можно скопировать
Почему так важна уникальность текста и как она влияет на SEO
Ingate Organic
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Похоже, Яндекс добрался таки до моих тестовых страниц. Пытаюсь проверить ранжирование по частоте упоминания термина.
Исходные частоты:
1, 5, 10, 15, 20, 25, 30, 35
Размеры страниц:
404, 463, 460, 453, 454, 409, 527, 519
В поиске страницы распределились в таком порядке:
5, 10, 15, 25, 20, 30, 35, 1
Совсем непонятна перестановка 25 <-> 20, все остальное в принципе как-то укладывается в схему. Я где-то лажанул? Поясните пожалуйста, кто может.
Странички сделаны с использованием генератора "чепухи" (уже давал ссылку), и последующей ручной расстановкой ранжируемого слова.
Страницы: my-homka my-culpage my-homsite my-gigapag my-supasite my-megapage my-supapage my-megasite на домене by.ru
PS Просьба не упоминать "термин" и не делать ссылки на страницы.
PPS По ходу дела вес слова в Яндексе можно считать величиной не строго расчетной.
Так, нескольким разным ключевикам присвоен одинаковый вес: 1819103916, сайтов - от 1 до 8, частота упоминания по проиндексированной коллекции - от 1 до 141.
Update: Функция вида 0,068*(частота в документе) - 0,005 ln(кол-во термина + 1) хорошо укладывает результаты с 1 по 7, объясняя скачок в 15->25->20, но ... врет для 8-го (где кол-во термина = 1). Сам Excel коэффициенты для такого вида функции не находит, чтоб удовлетворяли граничным условиям.
Update2: Проверил т.н. "тошноту". По классической формуле:
( частота_в_документе * корень( минимум(кол-во_самого_частого_слова, 7) ) )
монотонностью даже не пахнет. По модифицированной -
k1*частота_в_документе + k2 * корень( минимум(кол-во_самого_частого_слова, 7) )
точно также не подбираются коэффициенты для монотонности.
Если я правильно понимаю, то вычисляемая рядом сервисов (здесь например) "тошнота" вообще не имеет никакого практического применения.
Раз уж этот пост в разделе для новичков:
Как это считается и что даёт?
Дайте плз. ссылочку на эту функцию.
ИМХО: если кол-во термина=1, то это вообще не термин, а случайное упоминание слова.
Раз уж этот пост в разделе для новичков:
Как это считается и что даёт?
Общее количество вхождения термина по всем документам.
Дайте плз. ссылочку на эту функцию.
Ссылочки нет, т.к. это мое предположение (гипотеза по функции ранжирования).
Update2: Проверил т.н. "тошноту". По классической формуле:
( частота_в_документе * корень( минимум(кол-во_самого_частого_слова, 7) ) )
монотонностью даже не пахнет. По модифицированной -
k1*частота_в_документе + k2 * корень( минимум(кол-во_самого_частого_слова, 7) )
точно также не подбираются коэффициенты для монотонности.
Если я правильно понимаю, то вычисляемая рядом сервисов (здесь например) "тошнота" вообще не имеет никакого практического применения.
Подскажите, пожалуйста, где можно почитать про т.н. "тошноту". И что значит "частота_в_документе"? Т.е. "частота" чего?
( частота_в_документе * корень( минимум(кол-во_самого_частого_слова, 7) ) )
монотонностью даже не пахнет. По модифицированной -
k1*частота_в_документе + k2 * корень( минимум(кол-во_самого_частого_слова, 7) )
точно также не подбираются коэффициенты для монотонности.
Если я правильно понимаю, то вычисляемая рядом сервисов (здесь например) "тошнота" вообще не имеет никакого практического применения.
Подскажите, пожалуйста, где можно прочитать про т.н. "часттоту". И что значит "частота_в_документе"? Не совсем понятно чего это "частота"
Частота в документе (в моем случае) - отношение количества вхождений слова к общему количеству слов. Еще называют TF. Чтение - TF-IDF.
eolin, данные снимались во время апа или в ближайшие 2 дня после него?
1)
1, 5, 10, 15, 20, 25, 30, 35
Тогда в 1-й цитате % ?
2)Если уж проверяли "классическую" ( :) ) тошноту, надо было взять ряд (число вхождений) типа этого - 1,3,5,7,10,15,20,30
1)
Тогда в 1-й цитате % ?
2)Если уж проверяли "классическую" ( :) ) тошноту, надо было взять ряд (число вхождений) типа этого - 1,3,5,7,10,15,20,30
Не совсем точно выразился, количество вхождений слова в 1м случае. Не проценты, да. Размеры тоже в словах указаны.
Насчет классической "тошноты" - цели специально ее проверить не было. Но любые данные должны укладываться, если гипотеза верная. Если не укладывается - неверная.
Классическая математика - достаточно одного контрпримера, чтобы показать ложность гипотезы.
Да, там есть одна интересная и потенциально полезная деталь - что для низких количеств вхождений используется максимум из (7, кол-во вхождений). Насчет "волшебных" чисел тут много тоже говорили, почему 7, а не например 8 или 9. Но у Яндекса вообще много такого добра - одна степень 0.38 в голосовании по кворуму чего стоит. Или максимальный вес слова при переколдовке (см. здесь ранее).
Сейчас буду потихоньку уточнять табличку, сделаю еще с 3,6,7,8 вхождениями. Чтобы по максимуму в функции штрафа проверить.
Может кому интересно, появился небольшой апдейт:
Исходные данные снимались по состоянию на конец марта. Ряд ранжирования см. выше.
Затем проверял данные в марте, ранжирование страниц следующим образом:
5
10
25
15
20
30
35
1
То есть, с апреля по май Яндекс поменял текстовую релевантность (формулу). Подкрутили коэффициенты или что-то еще учитывают.
Далее по ходу было сделано изменение такого плана - была выставлена ссылка со странички 3го уровня вложенности, PR0/тИЦ 40, с одним словом - по которому идет исследование. Результат снимался на днях:
1
5
10
20
25
15
35
30
То есть результат вполне предсказуемый - одна ссылка перебила любые частоты употребления термина в тексте (ссылочное рулит, да). Примечательно другое - порядок опять поменялся. f=20 поднялась вверх на 2 позиции, f=30 - опустилась.
Страничка со ссылкой тоже отранжировалась - она последняя в выдаче.
Теперь немного информации по Google:
35
30
25
20
15
10
5
(с одной ссылкой)
Все абсолютно очевидно - чем больше термина, тем лучше. С единичным употреблением не со ссылкой вообще отсекается (видимо, фильтр на слишком низкую частоту/одиночную встречаемость). А вот страница со ссылкой отранжировалась. Да, PR=0 для нее, но PR PR-у рознь, возможно это повлияло. Возможно - просто фильтр работает на обычный текст, и обходит анкоры. Есть у кого достоверная информация на сей счет?
Вывод 1: "тошнота" есть только в Яндексе, для Google это неверно.
Вывод 2: Яндекс постоянно подкручивает текстовую релевантность - на анализаторах "тошноты" можно поставить крест. Общая тенденция - 5-10 употреблений термина сейчас золотая середина. Свыше - хуже ранжирование, очень редко (1-2 видимо) - тоже плохо.