wolf

wolf
Рейтинг
1183
Регистрация
13.03.2001
Должность
интернет-маркетинг, SEO
baltic13:
пункт 2.1, используется TF в Wsingle

Отлично. Там же чёрным по белому сказано, что TF - это число вхождений леммы в документ. Как это соотносится с Вашими "по определению"? ;)

kvkvkvkv:
енто когда слова в леммах будут встречаться по анкор-базе на порядок реже относительно ключа

Какие слова? Какого ключа? Корректно выражаться религия не позволяет, что ли? Да, и вообще выражение "слова в леммах" ускользает за пределы моего понимания...

baltic13:
То что с подачки Миныча кто-то стал называть количество вхождений леммы в документ TF только усложнило понимание.

Это не с подачки Миныча. Это с подачки теории Information Retrieval

baltic13:
Да и в Яндексе было подобное же определение..

Если не затруднит, подтвердите ссылочкой сие утверждение.

baltic13:
если вы внимательно прочитали мой пост, то должны были заметить, что так там и написано

Нет там не так написано. Вы сначала нормируете TF по длине документа (иначе интерпретировать фразу "TF=0.05 или 5%" я не могу). А потом второй раз нормируете по тошноте. Двойная нормировка - не слишком ли? ;)

baltic13:
А TF возмем классическое

В русскоязычной Википедии, извиняюсь, по этому поводу фигня написана. Они, так же как и Вы, под TF подразумевают её простейшую нормировку по длине документа. Почитайте более корректную англоязычную версию:


The term frequency in the given document is simply the number of times a given term appears in that document.

Чуете разницу между the number of times и Вашими процентами?

И только потом идет пример простейшей нормировки, которую Вы принимаете собственно за TF:


This count is usually normalized to prevent a bias towards longer documents...
baltic13:
А понизиться конкурент может, но только если анкор файл составлен таким образом, что ключевое слово будет менее весомым.
проще говоря, вес ключа будет низким в анкор файле.

Вы уж, будьте любезны, хоть как-то расшифровывайте свои сентенции. Что, к примеру, есть "низкий вес ключа в анкор-файле"?

baltic13:
она объясняет "перенасыщение" и "разжижение" анкор файла.

А кто-нибудь документально фиксировал эти "перенасыщение" и "разжижение"? Откуда хоть Вы эти термины взяли?

P.S. Вспомнились "одержание" и "всеобщее заболачивание" из "Улитки на склоне" Стругацких :)

alexander-russia:
Покупаем ссылке аккурат перед апом(ап рассчитываем сам не знаю как) где-то за 4-5 часов а после ап снимаем . Все ссылки через сап. Как это скажется на выдаче или это бред?

Не путайте апдейт с переиндексацией документов.

Caleb:
Ну как каким, вот составишь ты 15000 анкоров с ключевиком, и считай повысишь глобальный IDFa на 0,00000001.

Во-первых, понизишь, а во-вторых, не совсем уверен в практической ценности данного шага. Хотя, конечно, некоторая ценность в определенных ситуациях может быть. Но это уже очень изощреннно... :)

seonick:
Тогда каким образом частота вхождения термина в анкор-лист влияет на IDF, если это глобальная характеристика?

Я где-то говорил про конкретный анкор-лист? Я говорил о корпусе анкор-файлов, который является совокупностью всех анкор-листов.

1.Предположим, что норматвность TFa, как и TF есть максимально допустимая константа. Тогда вес документа по отношению термину обратнопропорционален весу самого термина.

Предположить можно, конечно, всё, что угодно... Только надо как-то всё-таки гипотезы проверять...

Кстати, в анкорном ранжировании есть некоторые факторы, влияющие на ранжирование, которых нет в текстовом. Это может вносить искажения во всякие эксперименты, если о них не знать и не учитывать их влияние. Так что, калькировать модель текстового ранжирование на анкорное - не совсем корректно.

seonick:
Получается реально понизить конкурента наставив анкор-файлов с точным еденичным упоминанием термина.
Допустим покупкой 15 000 ссылок на Ксапе с точным вхожденим термина я смогу понизить позиции конкурента?

Конкурента вы не понизите. IDFa конкретного термина - глобальная характеристика, она для всех одинаковая :)

Всего: 24501