- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов
А 24,9% – на сегмент электронной коммерции
Оксана Мамчуева
Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ
Экспертная оценка Адмитад
Оксана Мамчуева
AiK, а можно ли в личку примерчик?)
нет ... никакого фака не получится ..это уже видно
По вопросу о плотности - не получится. А вообще - получится.
Ну, вообще-то в цитате Сегаловича речь идет о несколько другой задаче, а именно об определении нечетких дубликатов.
Но, в общем-то, в плане темы топика не суть важно. Факт в том, что для определения веса страницы по отношению к термину, используется нормированная внутридокументная частота (по размеру страницы или по частоте самоту частотному термина), а не абсолютная. И поэтому говорить о оптимальном значении абсолютной частоты бессмысленно.
wolf, если говорить о практике, то можно заявить следующее:
Вопрос о влиянии только контента настолько ясен для нас, что для любой страницы, добавленной через адурелку можно на 100% предсказать точно, какая страница будет выше для однословных запросов (отсеиваем фактор одинаковой в принципе релевантности, КОТОРАЯ ЗАДАЕТСЯ ЦЕЛЫМ ЧИСЛОМ, НАПРИМЕР, когда для двух страниц релевантность одинакова типа 5 и 5).
А у Миныча есть табличка влияния фактора расстояния между словами, которая позволяет это делать почти для любых многословных запросов (где нет повторяющихся слов и переколдовка известна). И говорить при этом, что нам неизвестна оптимальная частота ключевика - у меня язык не поворачивается. :)
Лично мое мнение, полученное из опытов и многократно проверенное (Яндекс): оптимальная частота вхождения эквивалентно самому частому вхождению, причем чем больше в абсолютных цифрах, ТЕМ РЕЛЕВАНТНЕЕ.
Если мне сделать умное лицо, то формула релевантности для контента и однословного запроса выглядит так:
Р=(число ключевиков запроса)*sqrt(ln(глобальный вес слова))/sqrt(число самого частогj слова в документе)
глобальный вес слова это вес в переколдовке
🚬
Dervish, примеры в личку - это не наш выбор :)
Чистые примеры найти наверное нелегко будет, но попробовать можно.
Технология поиска такая: в Гугле набираешь запрос товар + бренд. И тот же самый запрос повторяешь в Яндексе. Смотри на те сайты, для которых Гугль выдаёт внутреннюю страницу, а Яндекс - морду.
Р=(число ключевиков запроса)*sqrt(ln(глобальный вес слова))/sqrt(число самого частогj слова в документе)
Надо заметить, что sqrt(ln(глобальный вес слова)) округляется Яндексом до пропорциональности целому числу, а не считается точно (ступеньки Миныча в алгоритме Яндекса
Лично мое мнение, полученное из опытов и многократно проверенное (Яндекс): оптимальная частота вхождения эквивалентно самому частому вхождению, причем чем больше в абсолютных цифрах, ТЕМ РЕЛЕВАНТНЕЕ.
Итак Вы уже указываете по крайней мере 2 условия -
1. Условие "оптимальная частота вхождения эквивалентно самому частому вхождению" я с Вашего позволения более строго интерпретирую как максимум его внутридокументной частоты, нормированной по самому частотному термину в документе, т.е. типа max(tf/tfmax)
2. Максимум внутридокументной частоты, т.е. просто max(tf).
Теперь рассмотрим Ваше правило поподробнее. В идеале получаем, что первый максимум достигается на самом частотном слове, т.е. если рассматриваемый термин и есть самое частотное слово. Второй максимум при условии выполнения первого достигается на 100% - ведь самое частотное слово по частоте сверху ничто не ограничивает. Получается идеальная плотность термина - 100%? Запишем это в ФАК?
олучается идеальная плотность термина - 100%? Запишем это в ФАК?
Нет, не так.
Пример:
Самое частое слово "репа":
на стр1 ее 100 штук
на стр2 ее 100 штук
На стр1 число слов 1000
на стр2 число слов 5000
Если Вицы стр1 и стр2 одинаковы, то стр1 и стр2 эквивалентны по релевантности к запросу репа и к другим запросам с одинаковым числом найденных пассажей.
Однако плотности репы у них РАЗНЫЕ!
Идеальной плотности НЕТ в Яндексе!
Идеальный вариант: чем больше нужного ключевика, тем лучше, на все остальные слова можно закрыть глаза, пока их меньше нужного.
Идеальной плотности НЕТ в Яндексе!
Что и требовалось доказать. :)
Теперь разбираем Ваши высказывания по полочкам. Чувствуется, что Вы путаетесь в терминологии. Вот тут:
оптимальная частота вхождения эквивалентно самому частому вхождению, причем чем больше в абсолютных цифрах, ТЕМ РЕЛЕВАНТНЕЕ.
Вы употребляете слово "частота". А потом, оказывается, что Вы подразумевали под ней просто кличество вхождений. Меж тем, под частотой в этом топике как бы подразумевается именно плотность, обозначаемая в литературе по IR как tf (term frequency) (см. термин "внутри-документная частота" у яндексоидов).
В общем, уточнив терминологию приходим, что Вы имеете в виду что главный критерий определения релевантности - это количество упоминаний термина, нормированное по количеству упоминаний самого частотного термина?
Т.е. max (N) max (N/Nmax)
В итоге имеем, что макимум веса документа по отношению к конкретному термину достигается тогда, когда он самый упоминаемый и количество его упоминаний в тексте стремится к бесконечности? Теперь я Вас правильно понял?
плотность ключевого слова в документе не должна превышать 5-7 % на 1000 знаков
как это надо понимать?
вариант1: число знаков ключевого слова в документе не должно превышать 5-7%
вариант2: число знаков ключевого слова в документе не должно превышать 5-7% если документ не более 1000 знаков
вариант3: число знаков ключевого слова в документе не должно превышать 5-7% если документ не менее 1000 знаков
В итоге имеем, что макимум веса документа по отношению к конкретному термину достигается тогда, когда он самый упоминаемый и количество его упоминаний в тексте стремится к бесконечности? Теперь я Вас правильно понял?
Правильно. Для контента, конечно.