- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов
А 24,9% – на сегмент электронной коммерции
Оксана Мамчуева
Переиграть и победить: как анализировать конкурентов для продвижения сайта
С помощью Ahrefs
Александр Шестаков
Вы считаете, что нормировка TF по анкор-файлу осуществляется по весу самого тяжелого термина?
По цене самого дорогого слова в директе :D :D
Отлично. Там же чёрным по белому сказано, что TF - это число вхождений леммы в документ. Как это соотносится с Вашими "по определению"? ;)
вы неправильно поняли, с как раз это и имел ввиду, что написано именно вхождений, с моим это никак не согласуется. меня вообщем-то это абсолютно не расстраивает.
значит не так изначально понял, теперь будем определять по науке, за что вам, wolf, наверное благодарен.
только это никак не меняет мысли, разве что все переформулировать надо на новый лад. смысл не измениться.
Каким образом задавит? Вы считаете, что нормировка TF по анкор-файлу осуществляется по весу самого тяжелого термина? Или по самому тяжелому произведению веса на количество употреблений термина?
"Задавит" видимо обозначает что редкое слово(слово с большим весом) мы имеем право употреблять тоже редко. Рассчитать вроде легко(мат. ожиданием) зная вероятность встретить слово в анкор-файле. Если встретили слово больше чем нужно (не попали в некоторое отклонение, например дисперсия), то значит определяются ссылки как спам и получают понижающий коэффициент.
По моему так...
Задавит" видимо обозначает что редкое слово(слово с большим весом) мы имеем право употреблять тоже редко.
Да, я когда-то высказывал подобную гипотезу. Но она осталась всего лишь гипотезой :)
Ребят, а вы че ссылки и текст с калькулятором составляете?
Похоже на то :) Теперь я понял, почему народ так живо интересуется обратными частотами... :)
TF как и любая частотная характеристика имеет неоднозначное толкование, поэтому большинство литературных источников использует ее с уточняющими индексами (например, TFt,d - встречаемость термина t в документе d) или с дополнительной расшифровкой (как в приведенном выше документе). В противном случае информативность этой величины отсутствует (попробуйте, например, измерять частоту вращения просто в оборотах, без указания интервала времени).
Теперь я понял, почему народ так живо интересуется обратными частотами... :)
А для вас этот интерес исключительно академический?
TF как и любая частотная характеристика имеет неоднозначное толкование, поэтому большинство литературных источников использует ее с уточняющими индексами (например, TFt,d - встречаемость термина t в документе d) или с дополнительной расшифровкой (как в приведенном выше документе). В противном случае информативность этой величины отсутствует (попробуйте, например, измерять частоту вращения просто в оборотах, без указания интервала времени).
TF - это не частота. Это количество употреблений. Непонимание этого факта и приводит к недоразумениям. Все переводят английское frequency самым распространенным вариантом "частота". Но забывают, что у него есть и еще один перевод - "частотность". В лингвистике частотностью лексемы называется
Точно также и IDF корректней переводить как "обратная частотность"
А для вас этот интерес исключительно академический?
Для меня в первую очередь интерес составляет подтверждение гипотез. И только потом их использование. А не оперирование неподтвержденными ;)
TF - это не частота. Это количество употреблений. Непонимание этого факта и приводит к недоразумениям. Все переводят английское frequency самым распространенным вариантом "частота". Но забывают, что у него есть и еще один перевод - "частотность".
Простите, но это синонимические игры. Приведенное Вами определение
также привязано к некоторому объему текста, без указания которого бессмысленно.
Закон Ципфа-Мандельброта оперирует понятием частоты употребления слов, несущим тот же смысл при указании объема выборки (словаря).
PS: А что вы думаете по поводу темы топика? Хотя бы на уровне: да - нет - не знаю...
Простите, но это синонимические игры. Приведенное Вами определение
Цитата:
количество лексов (т.е. словоупотреблений) одной лексемы в данном тексте (или в корпусе текстов, или в речевом фрагменте)
также привязано к некоторому объему текста, без указания которого бессмысленно.
Само собой, привязано. Как же иначе то? Только вот когда частоту (в данном случае - безразмерную величину) и количество (вполне размерную) называют синонимами, это мне представляется неправильным ;) Я математик, а не философ.
PS: А что вы думаете по поводу темы топика? Хотя бы на уровне: да - нет - не знаю...
Если Вы имеете в виду пост топикстартера, то смысл его от меня ускользает.
Любую информацию нужно использовать с умом. Сервис тоже полезен и для анкоров - для нахождения слов, с граничным весом.
А что значит граничный вес?