Фильтр ссылочной массы

W
На сайте с 13.10.2007
Offline
83
#111

Это и так было заметно, но все были на половину уверены и мнение делилось 50/50 о том влияет или не влияет прирост ссылок на позиции сайта.

Теперь четко сказано что качество и вид ссылочной накрутки влияет на позиции сайта. Назвали его не фильтром, а алгоритмом ранжирования поиска ;)

Официально обьявили - http://webmaster.ya.ru/

20 декабря мы начали учитывать много новых факторов, характеризующих страницу, ссылки на страницу, сайт в целом; лучше понимать тип запроса. Алгоритм стал более придирчиво относиться к качеству ссылок на страницу, научившись различать некоторые виды ссылочных накруток. Надеемся, что по многим запросам пользователи заметят улучшения.

aTrends.ru - сервис по анализу качества рекламы и конкурентов в Яндекс.Директ (http://atrends.ru)
B1
На сайте с 04.07.2006
Offline
44
#112
wolf:
Неверно. TF измеряется не в процентах

я же написал TF=0.05, а проценты к слову.

_S_
На сайте с 12.01.2006
Offline
109
_S_
#113
baltic13:
Нормировка анкор файла отлична от текстовой нормировки, вполне возможно, что по длине в словах.

Интересное предположение, на чем-нибудь основывается? 🚬

Читаешь блог? () Сайт о холодном оружии (http://bladeist.ru)
wolf
На сайте с 13.03.2001
Offline
1183
#114
baltic13:
я же написал TF=0.05, а проценты к слову.

Тогда давайте определимся, что лично Вы подразумеваете под TF? Количество вхождений искомого термина, деленное на общее количество терминов в тексте?

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
K
На сайте с 17.07.2007
Offline
29
#115
baltic13:
N-ая ссылка бесполезный параметр и по нему нет смысла фильтровать сайты.

1. Текст
Текстовая релевантность включает в себя два параметра TF и IDF.
IDF - для запроса это константа и повлиять на нее нельзя.
TF - влиять можно.
Нормальным (близким к естественному) считается TF=0.05 или 5%.
Часто задают вопрос у меня 20% ключевика на странице. за это забанят?
Сказать ничего нельзя, потому что в алгоритме фильтрации за текст учавствует нормированный TF. В нормировку входит и TFmax(тошнота)(есть, конечно, другие варианты, но против эксперимента не попрешь).


2. Анкор файл
Соввершенно однозначно, что ситуация такая же как и с текстом, влиять можно на TF.
Но нормировка должна отличаться, потому что:
пример: анкор файл состоит из 10 одинаковых слов - это порядок, за такое точно ничего не будет(проверено и возражений быть не может), а вот страничка, состоящая из 10 одинаковых слов(уникальных) в индекс не попадёт.
Цифра 10 не критична, можно поменять на 50, чтобы ощутить разницу.

Нормировка анкор файла отлична от текстовой нормировки, вполне возможно, что по длине в словах.

И нигде и никак количество ссылок не фигурирует, важны соотношения.

TF=0.05 откуда данные (теоретические, практические?)

Если IDF, IDFа константа, то как можно прокомментировать понятие "наращивание ссылочной массы" и т.д. (не может же изменение коллекции в поисковой системе происходят крайне редко, ну например, со сменой алгоритма)..

B1
На сайте с 04.07.2006
Offline
44
#116
wolf:
Тогда давайте определимся, что лично Вы подразумеваете под TF?

давайте.

TF (term frequency — частота слова) — отношение числа вхождения некоторого слова к общему количеству слов документа. Таким образом оценивается важность слова ti в пределах отдельного документа.

B1
На сайте с 04.07.2006
Offline
44
#117
Нормировка анкор файла отлична от текстовой нормировки, вполне возможно, что по длине в словах.

_S_, под длинной в словах подразумевается не количество всех слов во всем анкор файле, а количество различных лемм. Например, если в анкор файле всего 4 слова: "цветок", "цветками", "фиолетовый", "фиолетовыми" , то длина будет 2.

_S_:
Интересное предположение, на чем-нибудь основывается? 🚬

Такая нормировка объясняет "разжижение" и "перенасыщение" анкор файла.

TFнорм=tfi/(tfi+k1+k2*N)

где tfi - tf i-ого термина; k1,k2 - коэффициенты, N - длина или количество лемм в анкор файле

Если воспользоваться тем, что (k1+k2*N) >> tfi, то получим

TFнорм=x-x*x

где x=tfi/(k1+k2*N). График зависимости TFнорм от N :

Любопытно, что это и есть тот самый закон Гука, о котором говорил Aik в этом посте

Что конечно же совпадение.

K
На сайте с 17.07.2007
Offline
29
#118
baltic13:
_S_,
TFнорм=tfi/(tfi+k1+k2*N)
где tfi - tf i-ого термина; k1,k2 - коэффициенты, N - длина или количество лемм в анкор файле
Если воспользоваться тем, что (k1+k2*N) >> tfi, то получим

TFнорм=x-x*x
где x=tfi/(k1+k2*N).

не понятно, можете ссылочкой поделиться на исходник

wolf
На сайте с 13.03.2001
Offline
1183
#119
baltic13:
TF (term frequency — частота слова) — отношение числа вхождения некоторого слова к общему количеству слов документа. Таким образом оценивается важность слова ti в пределах отдельного документа.

Неверно. Это всего лишь одна из возможных нормировок TF. А само TF - не что иное, как количество упоминаний термина в тексте. Но как правило, в алгоритмах ранжирования используется не сама эта величина, а ее нормированное значение. Так вот, повторюсь, одной их простейших нормировок является нормировка по длине текста в словах. Но в поисковых алгоритмах используются, как правило, гораздо более сложные нормировки. Например, BM25. В Яндексе в нормировке TF для текстовой релевантности вообще не используется понятия длины документа, там нормирование происходит по другому параметру - максимальной TF. И Ваше "отношение числа вхождения некоторого слова к общему количеству слов документа" в этом случае вообще теряет смысл. Какая же нормировка используется Яндексом при ранжировании по анкор-файлу - это есть вопрос для оптимизаторского сообщества пока открытый ;)

wolf
На сайте с 13.03.2001
Offline
1183
#120
baltic13:
Такая нормировка объясняет "разжижение" и "перенасыщение" анкор файла.

TFнорм=tfi/(tfi+k1+k2*N)
где tfi - tf i-ого термина; k1,k2 - коэффициенты, N - длина или количество лемм в анкор файле
Если воспользоваться тем, что (k1+k2*N) >> tfi, то получим

TFнорм=x-x*x
где x=tfi/(k1+k2*N). График зависимости TFнорм от N :
http://content.foto.mail.ru/mail/andava/SEO/i-5.jpg

А с чего Вы решили, что именно эта нормировка используется при анкорном ранжировании в Яндексе? Тут, кстати, модно больше за "тошноту" говорить по аналогии с текстовым ранжированием (а "тошнотой" с легкой руки Миныча здесь принято называть как раз таки максимум TF по всем терминам) :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий