- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Как удалить плохие SEO-ссылки и очистить ссылочную массу сайта
Применяем отклонение ссылок
Сервис Rookee
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Похоже, Яндекс добрался таки до моих тестовых страниц. Пытаюсь проверить ранжирование по частоте упоминания термина.
Исходные частоты:
1, 5, 10, 15, 20, 25, 30, 35
Размеры страниц:
404, 463, 460, 453, 454, 409, 527, 519
В поиске страницы распределились в таком порядке:
5, 10, 15, 25, 20, 30, 35, 1
Совсем непонятна перестановка 25 <-> 20, все остальное в принципе как-то укладывается в схему. Я где-то лажанул? Поясните пожалуйста, кто может.
Странички сделаны с использованием генератора "чепухи" (уже давал ссылку), и последующей ручной расстановкой ранжируемого слова.
Страницы: my-homka my-culpage my-homsite my-gigapag my-supasite my-megapage my-supapage my-megasite на домене by.ru
PS Просьба не упоминать "термин" и не делать ссылки на страницы.
PPS По ходу дела вес слова в Яндексе можно считать величиной не строго расчетной.
Так, нескольким разным ключевикам присвоен одинаковый вес: 1819103916, сайтов - от 1 до 8, частота упоминания по проиндексированной коллекции - от 1 до 141.
Update: Функция вида 0,068*(частота в документе) - 0,005 ln(кол-во термина + 1) хорошо укладывает результаты с 1 по 7, объясняя скачок в 15->25->20, но ... врет для 8-го (где кол-во термина = 1). Сам Excel коэффициенты для такого вида функции не находит, чтоб удовлетворяли граничным условиям.
Update2: Проверил т.н. "тошноту". По классической формуле:
( частота_в_документе * корень( минимум(кол-во_самого_частого_слова, 7) ) )
монотонностью даже не пахнет. По модифицированной -
k1*частота_в_документе + k2 * корень( минимум(кол-во_самого_частого_слова, 7) )
точно также не подбираются коэффициенты для монотонности.
Если я правильно понимаю, то вычисляемая рядом сервисов (здесь например) "тошнота" вообще не имеет никакого практического применения.
Раз уж этот пост в разделе для новичков:
Как это считается и что даёт?
Дайте плз. ссылочку на эту функцию.
ИМХО: если кол-во термина=1, то это вообще не термин, а случайное упоминание слова.
Раз уж этот пост в разделе для новичков:
Как это считается и что даёт?
Общее количество вхождения термина по всем документам.
Дайте плз. ссылочку на эту функцию.
Ссылочки нет, т.к. это мое предположение (гипотеза по функции ранжирования).
Update2: Проверил т.н. "тошноту". По классической формуле:
( частота_в_документе * корень( минимум(кол-во_самого_частого_слова, 7) ) )
монотонностью даже не пахнет. По модифицированной -
k1*частота_в_документе + k2 * корень( минимум(кол-во_самого_частого_слова, 7) )
точно также не подбираются коэффициенты для монотонности.
Если я правильно понимаю, то вычисляемая рядом сервисов (здесь например) "тошнота" вообще не имеет никакого практического применения.
Подскажите, пожалуйста, где можно почитать про т.н. "тошноту". И что значит "частота_в_документе"? Т.е. "частота" чего?
( частота_в_документе * корень( минимум(кол-во_самого_частого_слова, 7) ) )
монотонностью даже не пахнет. По модифицированной -
k1*частота_в_документе + k2 * корень( минимум(кол-во_самого_частого_слова, 7) )
точно также не подбираются коэффициенты для монотонности.
Если я правильно понимаю, то вычисляемая рядом сервисов (здесь например) "тошнота" вообще не имеет никакого практического применения.
Подскажите, пожалуйста, где можно прочитать про т.н. "часттоту". И что значит "частота_в_документе"? Не совсем понятно чего это "частота"
Частота в документе (в моем случае) - отношение количества вхождений слова к общему количеству слов. Еще называют TF. Чтение - TF-IDF.
eolin, данные снимались во время апа или в ближайшие 2 дня после него?
1)
1, 5, 10, 15, 20, 25, 30, 35
Тогда в 1-й цитате % ?
2)Если уж проверяли "классическую" ( :) ) тошноту, надо было взять ряд (число вхождений) типа этого - 1,3,5,7,10,15,20,30
1)
Тогда в 1-й цитате % ?
2)Если уж проверяли "классическую" ( :) ) тошноту, надо было взять ряд (число вхождений) типа этого - 1,3,5,7,10,15,20,30
Не совсем точно выразился, количество вхождений слова в 1м случае. Не проценты, да. Размеры тоже в словах указаны.
Насчет классической "тошноты" - цели специально ее проверить не было. Но любые данные должны укладываться, если гипотеза верная. Если не укладывается - неверная.
Классическая математика - достаточно одного контрпримера, чтобы показать ложность гипотезы.
Да, там есть одна интересная и потенциально полезная деталь - что для низких количеств вхождений используется максимум из (7, кол-во вхождений). Насчет "волшебных" чисел тут много тоже говорили, почему 7, а не например 8 или 9. Но у Яндекса вообще много такого добра - одна степень 0.38 в голосовании по кворуму чего стоит. Или максимальный вес слова при переколдовке (см. здесь ранее).
Сейчас буду потихоньку уточнять табличку, сделаю еще с 3,6,7,8 вхождениями. Чтобы по максимуму в функции штрафа проверить.
Может кому интересно, появился небольшой апдейт:
Исходные данные снимались по состоянию на конец марта. Ряд ранжирования см. выше.
Затем проверял данные в марте, ранжирование страниц следующим образом:
5
10
25
15
20
30
35
1
То есть, с апреля по май Яндекс поменял текстовую релевантность (формулу). Подкрутили коэффициенты или что-то еще учитывают.
Далее по ходу было сделано изменение такого плана - была выставлена ссылка со странички 3го уровня вложенности, PR0/тИЦ 40, с одним словом - по которому идет исследование. Результат снимался на днях:
1
5
10
20
25
15
35
30
То есть результат вполне предсказуемый - одна ссылка перебила любые частоты употребления термина в тексте (ссылочное рулит, да). Примечательно другое - порядок опять поменялся. f=20 поднялась вверх на 2 позиции, f=30 - опустилась.
Страничка со ссылкой тоже отранжировалась - она последняя в выдаче.
Теперь немного информации по Google:
35
30
25
20
15
10
5
(с одной ссылкой)
Все абсолютно очевидно - чем больше термина, тем лучше. С единичным употреблением не со ссылкой вообще отсекается (видимо, фильтр на слишком низкую частоту/одиночную встречаемость). А вот страница со ссылкой отранжировалась. Да, PR=0 для нее, но PR PR-у рознь, возможно это повлияло. Возможно - просто фильтр работает на обычный текст, и обходит анкоры. Есть у кого достоверная информация на сей счет?
Вывод 1: "тошнота" есть только в Яндексе, для Google это неверно.
Вывод 2: Яндекс постоянно подкручивает текстовую релевантность - на анализаторах "тошноты" можно поставить крест. Общая тенденция - 5-10 употреблений термина сейчас золотая середина. Свыше - хуже ранжирование, очень редко (1-2 видимо) - тоже плохо.