- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

Что делать, если ваша email-рассылка попала в спам
10 распространенных причин и решений
Екатерина Ткаченко
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
это частота терма, а по-Вашему что?
Что есть в Вашем понимании частота в данном случае?
Что есть в Вашем понимании частота в данном случае?
Отношение числа вхождения некоторого слова к общему количеству слов в документе
Отношение числа вхождения некоторого слова к общему количеству слов в документе
Теперь читаем определения. Серьезную литературу пока трогать не будем, отшлю к научно-популярной:
The term frequency in the given document is simply the number of times a given term appears in that document
А вот про отношение сказано далее в том смысле, что
This count is usually normalized to prevent a bias towards longer documents
То есть TF может быть нормализована, и одним из способов нормировки является нормировка по длине документа, т.е. то, что Вы называете "Отношение числа вхождения некоторого слова к общему количеству слов в документе". Но это лишь один из способов. И далеко не факт, что именно он используется поисковиками. И даже факт, что не используется Яндексом. На досуге советую поискать некоторые популярные в IR нормировки (некоторые из них упоминает Сегалович в ствоей статье http://company.yandex.ru/articles/romip2004.xml ). И попробовать вычислить зависимость от той величины, которой Вы оперируете :)
А смысл этой величины без нормировки?
А это тут причем я этого не утверждал)
А смысл этой величины без нормировки?
Дык, в том-то и дело, что нормировки бывают разные. И далеко не все они оперируют понятием размера документа. А Вы размер документа в качестве нормировки подразумеваете по умолчанию. И совершенно напрасно. Яндекс вот, к примеру, нормирует по той самой тошноте, которой посвящен топик, а не по размеру документа.
Дык, в том-то и дело, что нормировки бывают разные. И далеко не все они оперируют понятием размера документа. А Вы размер документа в качестве нормировки подразумеваете по умолчанию. И совершенно напрасно. Яндекс вот, к примеру, нормирует по той самой тошноте, которой посвящен топик, а не по размеру документа.
Справедливо замечено
Господа, вопрос следующий.
Нарвался сегодня на сабж... проверил свой сайт www.binoculars.ru у него самое часто встречаемое слово - бинокли. Спросил у яндекса. на 1 месте www.4glaza.ru. У них и количество слов "Бинокли" на странице больше и тошнота, однако они все равно на 1 месте.
pterodaktil, вэлкам (вот тут и пишите!) =)
Предел тошноты измеряется не в процентах! Если вхождений слова больше чем 25 раз, то это уже тошнота.
pterodaktil, и что Вас удивляет? Тошнота определяемая биноклями не мешает двигаться им по биноклям. Может мешать продвигаться по другим ключевым словам.
Кроме того, еще ссылки есть, ими можно многое скомпенсировать, правда затраты будут больше.
doctor_buzzz, тошнота, всегда тошнота. А цифра 25 вообще откуда всплыла?