Фильтр ссылочной массы

_S_
На сайте с 12.01.2006
Offline
109
_S_
#191
happy-joker:
Отталкиваясь от этого кейворда, все анкоры можно условно разделить

Если влияние полноты в большую сторону мне понятна, то в меньшую - не совсем.

Кстати, сейчас пассаж=анкор, так что теперь хз.

wolf:
Экстраполировано из текстовой обратной частотности?

Обобщенно да. (я про текстовую и говорил) На мой взгляд, что касается частотности, алгоритм в общих чертах идентичен с текстовым.

Читаешь блог? () Сайт о холодном оружии (http://bladeist.ru)
wolf
На сайте с 13.03.2001
Offline
1183
#192
_S_:
Обобщенно да. (я про текстовую и говорил)

Так тут, вроде разговор за анкорную идет. Хотя уже фиг его знает... :)

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
_S_
На сайте с 12.01.2006
Offline
109
_S_
#193
wolf:
Так тут, вроде разговор за анкорную идет. Хотя уже фиг его знает...

Ну слова, которые совсем не встречаются в анкорах можно ж определить :) А вот вес тех, что встречаются, но редко - увы, я не знаю как определить максимальный ли у них вес или нет :)

Как я и говорил - мое имхо - с частотностью в анкорах тот же коленкор, что и с текстовом а следовательно я принимаю принципы текстового.

kinar
На сайте с 07.10.2007
Offline
142
#194

А если говноссылки вообще не покупать? Я просто гляжу, что тут много любителей говноссылок с сапы. Я вообще туда не хожу. Если, скажем, я покупаю места под ссылку с параметрами типа pr 1 тИЦ 10 (у моего сайта - 4 550)- это говноссылка? Причем сайт нормальный, для людей. И в анкоре ставил раньше один ключевик только, этот сайт сейчас в топе (2 место). Ничего не склеилось, правда, ссылок купил по количеству немного, но по жирности страниц достаточно.

На другие же сайты в начале декабря начал закупку ссылок, сайт уверенно упал из топа на позиции "подход к топу" (11-14 места)... Жду апов, чтобы понять, в чем дело. Сейчас стал ставить эксперименты с разными параметрами, о результатах сообщу.

Йога по скайпу! (http://www.joga-skype.ru/) Старинные медицинские книги по психиатрии (http://medbasis.ru)
B
На сайте с 30.06.2006
Offline
104
#195
MiRaj:
Wolf,
Пусть себе учатся как могут, меня вообще удивляет столь резкий всплеск "теоретических" исследований алгоритмов ранжирования в последнее время.
Правда, все эти исследования остаются на уровне "я знаю карате, кунг-фу и много других страшных слов." :D

Совершенно согласен - когда ставишь сам эксперименты, то картина становится более понятной, а создают топики кому лень ставить эксперименты, и немного подумать, ничего легкого нет.

B
На сайте с 30.06.2006
Offline
104
#196

Скажу одно - фильтр существует на определенный вид ссылок😂

XR
На сайте с 02.09.2005
Offline
92
#197
kinar:
А если говноссылки вообще не покупать? Я просто гляжу, что тут много любителей говноссылок с сапы. Я вообще туда не хожу. Если, скажем, я покупаю места под ссылку с параметрами типа pr 1 тИЦ 10 (у моего сайта - 4 550)- это говноссылка? Причем сайт нормальный, для людей. И в анкоре ставил раньше один ключевик только, этот сайт сейчас в топе (2 место). Ничего не склеилось, правда, ссылок купил по количеству немного, но по жирности страниц достаточно.

На другие же сайты в начале декабря начал закупку ссылок, сайт уверенно упал из топа на позиции "подход к топу" (11-14 места)... Жду апов, чтобы понять, в чем дело. Сейчас стал ставить эксперименты с разными параметрами, о результатах сообщу.

Если сайт, с которого Вы покупаете ссылку, "нормальный и для людей", то нет, это не "говноссылка". Просто не очень мощная ссылка для продвижения средне-/низкоконкурентных запросов. Просто реалии таковы, что "говноссылок" с аналогичных же сайтов довольно много в продаже.

Консультации по продвижению сайтов. Многое даю бесплатно. Пишите в личку, договоримся.
B1
На сайте с 04.07.2006
Offline
44
#198
wolf:
Из результатов собственных исследований

понятно. а какова схема исследования?

по собственной теории предсказываете позиции исследуемых сайтов, тем самым подтверждаете или опровергаете предположения?

wolf:

Сорри, но я не понимаю, что Вы пишете. Нормирование по W???

нормировка W определенного термина в анкор файле по W остальных терминов в том же анкор файле. R. Larson, M. Hearst упоминали подобное.

Зачем это нужно?

затем, что TF нормируется на промежуток от 0 до 1 (или 0,5 -1 ), а IDF нет.

wolf, как вы относитесь к фильтрам на анкор файл? нужны ли они для повышения качества поиска?

Под фильтром понимаю ручной ввод ограничения какого либо параметра, например, если tf=1000,то урезать tf до 100.

wolf
На сайте с 13.03.2001
Offline
1183
#199
baltic13:
понятно. а какова схема исследования?
по собственной теории предсказываете позиции исследуемых сайтов, тем самым подтверждаете или опровергаете предположения?

Нет. Строю аналитическую модель ранжирования на основе данных, полученных с помощью специальным образом построенных запросов.

baltic13:
нормировка W определенного термина в анкор файле по W остальных терминов в том же анкор файле. R. Larson, M. Hearst упоминали подобное.
Зачем это нужно?
затем, что TF нормируется на промежуток от 0 до 1 (или 0,5 -1 ), а IDF нет.

Это не есть нормировка по W, как Вы писали. Это есть нормировка TF по какому либо параметру (например, длине документа или частотности самого частотного термина). IDF, кстати, логарифмируется и тоже загоняется тем самым в довольно небольшой числовой промежуток.

baltic13:
wolf, как вы относитесь к фильтрам на анкор файл? нужны ли они для повышения качества поиска?

А как к ним прикажете относиться? Я могу к ним относиться только как к объективной реальности. Если, она, конечно, существует... :)

B1
На сайте с 04.07.2006
Offline
44
#200
wolf:

Это не есть нормировка по W, как Вы писали. Это есть нормировка TF по какому либо параметру (например, длине документа или частотности самого частотного термина).

изложу мысль подробнее.

Давайте обозначать маленькими буквами НЕ нормированые величины, а большими - нормированные.

tf - не норм-а

TF - норм-а

итд.

W=TF*IDF в документе, а потом нормирование по W во всём анкор файле.

нормировки по w сущесвенно отличаются от нормировок tf и idf.

Нормировки tf

1. tf/tfmax

2. 0.5 + 0.5tf/tfmax

3. логарифмическая

4. по длине, bm25

Нормировки idf

1. log(x)

2. log(x)*log(x) (квадратичная)

3. log(x-1)

4. обратное количество документов с термином

Нормировки w (normw)

1. сумма w

2. sqrt(сумма w*w)

3. сумма w*w*w*w

4. max(w)

суммируется по всем терминам документа

Как не сложно заметить все они отличаются существенно, поэтому я говорю именно о последней, а не об нормировке tf или idf.

А вобщем нормированная величина определяется так (может определяться так, я на данный момент считаю так)

W = TF*IDF/normw

где normw - один из 4ёх видов нормировки w.

wolf:

IDF, кстати, логарифмируется и тоже загоняется тем самым в довольно небольшой числовой промежуток.

есть нормировка квадрат log, которая может расширить этот промежуток.

wolf:

А как к ним прикажете относиться? Я могу к ним относиться только как к объективной реальности. Если, она, конечно, существует... :)

относиться можно к ним по-другому.

фильтров нет, это все особенности функции. так все изначально задумано.. ну не важно. понятно вобщем.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий