baltic13

Рейтинг
44
Регистрация
04.07.2006
Интересы
преф
wolf:
В анкор-файле контрастность имеет вид TF*IDF*IDFa,

откуда вы это взяли?

wolf:
Ок, примем такую гипотезу. А почему - можете обосновать?

W=TF*IDF в документе, а потом нормирование по W во всём анкор файле. отсюда и получается плохо. нормирование веса имеет смысл, а то получиться, что один серьезно продвигаемый ключевик в топы "затащит" кучу составных запросов.

wolf:
Отлично. Там же чёрным по белому сказано, что TF - это число вхождений леммы в документ. Как это соотносится с Вашими "по определению"? ;)

вы неправильно поняли, с как раз это и имел ввиду, что написано именно вхождений, с моим это никак не согласуется. меня вообщем-то это абсолютно не расстраивает.

значит не так изначально понял, теперь будем определять по науке, за что вам, wolf, наверное благодарен.

только это никак не меняет мысли, разве что все переформулировать надо на новый лад. смысл не измениться.

wolf:
А кто-нибудь документально фиксировал эти "перенасыщение" и "разжижение"? Откуда хоть Вы эти термины взяли?

документально никто не фиксировал.

взяты термины из практики собственной.

"разжижение" - продвижение одной страницы(чаще главной) по большому количеству запросов конкурентных затруднительно. Если запросы разнести на разные страницы (или поддомены) и приложить те же усилия, позиции существенно повышаются.

"перенасыщение" - при высокой частоте ключевой фразы в текстах ссылок продвижение осложняется. При разбавлении - позции улучшаются.

Подобного рода термины появляются в связи со сложностями точно описать алгоритм. А на каких-то промежутках описывать сложные функции простыми практически удобнее и менее трудозатратнее.

пример, ln(1+x)=x при малых x

вы и так это, наверное, понимаете :)

wolf:
Вы уж, будьте любезны, хоть как-то расшифровывайте свои сентенции. Что, к примеру, есть "низкий вес ключа в анкор-файле"?

на примере если можно.

абракадабра в текстах ссылок отрицательно влияет на ключевик.

New_Angel:
Ну как же? ;) См. переколдовка новая от Миража! )))

это веса для текста, IDF.

wolf:
Если не затруднит, подтвердите ссылочкой сие утверждение.

http://download.yandex.ru/company/03_yandex.pdf

пункт 2.1, используется TF в Wsingle

wolf:
Нет там не так написано. Вы сначала нормируете TF по длине документа (иначе интерпретировать фразу "TF=0.05 или 5%" я не могу). А потом второй раз нормируете по тошноте. Двойная нормировка - не слишком ли?

TF я не нормирую по длине, она такая по определению (по крайней мере я так считал, когда писал. сйечас пока еще так же считаю).

wolf:
В русскоязычной Википедии, извиняюсь, по этому поводу фигня написана. Они, так же как и Вы, под TF подразумевают её простейшую нормировку по длине документа. Почитайте более корректную англоязычную версию

согласен. подумаю.. наверное, стоит будет переобозначить 🚬

TimeBomb,

/ru/forum/190925

/ru/forum/178072

проезжали

seonick:
Получается реально понизить конкурента наставив анкор-файлов с точным еденичным упоминанием термина.
Допустим покупкой 15 000 ссылок на Ксапе с точным вхожденим термина я смогу понизить позиции конкурента?

таким способ понизиться не конкурент, а IDFa. А понизиться конкурент может, но только если анкор файл составлен таким образом, что ключевое слово будет менее весомым.

проще говоря, вес ключа будет низким в анкор файле.

wolf:
А с чего Вы решили, что именно эта нормировка используется при анкорном ранжировании в Яндексе?

она объясняет "перенасыщение" и "разжижение" анкор файла. поэтому есть смысл понаблюдать за таким вариантом, пока не найдется достаточно контр примеров.

kvkvkvkv:
не понятно, можете ссылочкой поделиться на исходник

общий вид в статье яндексойдов можете посмотреть, но там параметры не такие.

kvkvkvkv:
TF=0.05 откуда данные (теоретические, практические?)

практические. любой естественный текст берем и смотрим.

kvkvkvkv:
Если IDF, IDFа константа, то как можно прокомментировать понятие "наращивание ссылочной массы" и т.д.

сильно укрупненная формула

Rа(x)=(m*Tа(x)+p*Lа(x))* F(PRa)

F(PRa) - вот этим параметром можно прокомментировать понятие "наращивание ссылочной массы"

wolf:
Неверно. Это всего лишь одна из возможных нормировок TF. А само TF - не что иное, как количество упоминаний термина в тексте.

что значит не верно? :) вы спросили как я считаю, я ответил. Могу так же ссылку дать TF. То что с подачки Миныча кто-то стал называть количество вхождений леммы в документ TF только усложнило понимание. Да и в Яндексе было подобное же определение..

Вобщем здесь нет правых и неправых. Буду конкретизировать впредь.


В Яндексе в нормировке TF для текстовой релевантности вообще не используется понятия длины документа, там нормирование происходит по другому параметру - максимальной TF.

если вы внимательно прочитали мой пост, то должны были заметить, что так там и написано

wolf:

И Ваше "отношение числа вхождения некоторого слова к общему количеству слов документа" в этом случае вообще теряет смысл.

Ха.. ну как же так. ничего никто не теряет. Давайте на время обозначим количество вхождений леммы в документе за N, а Nmax - "тошнота", наибольшее кол-во вхождении леммы.

А TF возмем классическое, TFmax - максимальная частота термина в документе. Тогда

N/Nmax = TF/TFmax

А вы говорите теряет смысл...

Какая же нормировка используется Яндексом при ранжировании по анкор-файлу - это есть вопрос для оптимизаторского сообщества пока открытый ;)

ок

Всего: 253