wolf

wolf
Рейтинг
1183
Регистрация
13.03.2001
Должность
интернет-маркетинг, SEO
Tryerty:
Простите, но это синонимические игры. Приведенное Вами определение
Цитата:
количество лексов (т.е. словоупотреблений) одной лексемы в данном тексте (или в корпусе текстов, или в речевом фрагменте)
также привязано к некоторому объему текста, без указания которого бессмысленно.

Само собой, привязано. Как же иначе то? Только вот когда частоту (в данном случае - безразмерную величину) и количество (вполне размерную) называют синонимами, это мне представляется неправильным ;) Я математик, а не философ.

Tryerty:
PS: А что вы думаете по поводу темы топика? Хотя бы на уровне: да - нет - не знаю...

Если Вы имеете в виду пост топикстартера, то смысл его от меня ускользает.

Tryerty:
TF как и любая частотная характеристика имеет неоднозначное толкование, поэтому большинство литературных источников использует ее с уточняющими индексами (например, TFt,d - встречаемость термина t в документе d) или с дополнительной расшифровкой (как в приведенном выше документе). В противном случае информативность этой величины отсутствует (попробуйте, например, измерять частоту вращения просто в оборотах, без указания интервала времени).

TF - это не частота. Это количество употреблений. Непонимание этого факта и приводит к недоразумениям. Все переводят английское frequency самым распространенным вариантом "частота". Но забывают, что у него есть и еще один перевод - "частотность". В лингвистике частотностью лексемы называется

количество лексов (т.е. словоупотреблений) одной лексемы в данном тексте (или в корпусе текстов, или в речевом фрагменте)
http://slovari.yandex.ru/dict/krugosvet/article/krugosvet/6/1009216.htm

Точно также и IDF корректней переводить как "обратная частотность"

Tryerty:
А для вас этот интерес исключительно академический?

Для меня в первую очередь интерес составляет подтверждение гипотез. И только потом их использование. А не оперирование неподтвержденными ;)

Sijaw:
Я в курсе прекрасно что он фильтрует сайты в одной тематике, я имел ввиду что стакнулся с этим с сайтами разных тематик.

Если у них разные тематики, то как возникает пересечение?

Gopneg:
Ребят, а вы че ссылки и текст с калькулятором составляете?

Похоже на то :) Теперь я понял, почему народ так живо интересуется обратными частотами... :)

ygr:
Задавит" видимо обозначает что редкое слово(слово с большим весом) мы имеем право употреблять тоже редко.

Да, я когда-то высказывал подобную гипотезу. Но она осталась всего лишь гипотезой :)

DyaDya:
У кого есть друзья модеры яшки?

Ну да, конечно, тут у каждого второго в друганах Платоша Щукин числится 😂

Caleb:
Да че тут обосновывать, абракадабра используется в анкорах редко, соотвественно глобальный вес у этого слова большой, по сравнению с каким-нибудь распространенным ключевиком, у которого вес меньше. Абракадабра задавит ключевик своим весом в анкорной массе сайта и сайт по запросу спадет.

Каким образом задавит? Вы считаете, что нормировка TF по анкор-файлу осуществляется по весу самого тяжелого термина? Или по самому тяжелому произведению веса на количество употреблений термина?

baltic13:
Сообщение от wolf Посмотреть сообщение
А с чего Вы решили, что именно эта нормировка используется при анкорном ранжировании в Яндексе?

она объясняет "перенасыщение" и "разжижение" анкор файла. поэтому есть смысл понаблюдать за таким вариантом, пока не найдется достаточно контр примеров.
baltic13:
"перенасыщение" - при высокой частоте ключевой фразы в текстах ссылок продвижение осложняется. При разбавлении - позции улучшаются.

Покажите мне, как Ваша гипотетическая формула

TFнорм=tfi/(tfi+k1+k2*N)
где tfi - tf i-ого термина; k1,k2 - коэффициенты, N - длина или количество лемм в анкор файле

объясняет "перенасыщение"? С учетом того, что tfi - это число вхождений i-го термина

Лепим все анкоры одинаковые и однословные, состоящие из этого термина. В итоге имеем максимум функции TFнорм, т.к. при этом минимизируем величину N (т.к. левых терминов в анкор-файле нет) и максимизируем tfi.

baltic13:
Сообщение от wolf
Вы уж, будьте любезны, хоть как-то расшифровывайте свои сентенции. Что, к примеру, есть "низкий вес ключа в анкор-файле"?

на примере если можно.
абракадабра в текстах ссылок отрицательно влияет на ключевик.

Ок, примем такую гипотезу. А почему - можете обосновать?

kvkvkvkv:
Слова, которые не являются ключевыми в запросе

Да уж, чем дальше в лес, тем толще партизаны. Что значит это "слова, которые не являются ключевыми в запросе"? То есть Вы делите слова из запроса на ключевые и неключевые? Честное слово, я устал продираться сквозь подобное черезчур вольное жонглирование в терминологии... Я не понимаю этот язык...

Всего: 24501