- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Отталкиваясь от этого кейворда, все анкоры можно условно разделить
Если влияние полноты в большую сторону мне понятна, то в меньшую - не совсем.
Кстати, сейчас пассаж=анкор, так что теперь хз.
Экстраполировано из текстовой обратной частотности?
Обобщенно да. (я про текстовую и говорил) На мой взгляд, что касается частотности, алгоритм в общих чертах идентичен с текстовым.
Обобщенно да. (я про текстовую и говорил)
Так тут, вроде разговор за анкорную идет. Хотя уже фиг его знает... :)
Так тут, вроде разговор за анкорную идет. Хотя уже фиг его знает...
Ну слова, которые совсем не встречаются в анкорах можно ж определить :) А вот вес тех, что встречаются, но редко - увы, я не знаю как определить максимальный ли у них вес или нет :)
Как я и говорил - мое имхо - с частотностью в анкорах тот же коленкор, что и с текстовом а следовательно я принимаю принципы текстового.
А если говноссылки вообще не покупать? Я просто гляжу, что тут много любителей говноссылок с сапы. Я вообще туда не хожу. Если, скажем, я покупаю места под ссылку с параметрами типа pr 1 тИЦ 10 (у моего сайта - 4 550)- это говноссылка? Причем сайт нормальный, для людей. И в анкоре ставил раньше один ключевик только, этот сайт сейчас в топе (2 место). Ничего не склеилось, правда, ссылок купил по количеству немного, но по жирности страниц достаточно.
На другие же сайты в начале декабря начал закупку ссылок, сайт уверенно упал из топа на позиции "подход к топу" (11-14 места)... Жду апов, чтобы понять, в чем дело. Сейчас стал ставить эксперименты с разными параметрами, о результатах сообщу.
Wolf,
Пусть себе учатся как могут, меня вообще удивляет столь резкий всплеск "теоретических" исследований алгоритмов ранжирования в последнее время.
Правда, все эти исследования остаются на уровне "я знаю карате, кунг-фу и много других страшных слов." :D
Совершенно согласен - когда ставишь сам эксперименты, то картина становится более понятной, а создают топики кому лень ставить эксперименты, и немного подумать, ничего легкого нет.
Скажу одно - фильтр существует на определенный вид ссылок😂
А если говноссылки вообще не покупать? Я просто гляжу, что тут много любителей говноссылок с сапы. Я вообще туда не хожу. Если, скажем, я покупаю места под ссылку с параметрами типа pr 1 тИЦ 10 (у моего сайта - 4 550)- это говноссылка? Причем сайт нормальный, для людей. И в анкоре ставил раньше один ключевик только, этот сайт сейчас в топе (2 место). Ничего не склеилось, правда, ссылок купил по количеству немного, но по жирности страниц достаточно.
На другие же сайты в начале декабря начал закупку ссылок, сайт уверенно упал из топа на позиции "подход к топу" (11-14 места)... Жду апов, чтобы понять, в чем дело. Сейчас стал ставить эксперименты с разными параметрами, о результатах сообщу.
Если сайт, с которого Вы покупаете ссылку, "нормальный и для людей", то нет, это не "говноссылка". Просто не очень мощная ссылка для продвижения средне-/низкоконкурентных запросов. Просто реалии таковы, что "говноссылок" с аналогичных же сайтов довольно много в продаже.
Из результатов собственных исследований
понятно. а какова схема исследования?
по собственной теории предсказываете позиции исследуемых сайтов, тем самым подтверждаете или опровергаете предположения?
Сорри, но я не понимаю, что Вы пишете. Нормирование по W???
нормировка W определенного термина в анкор файле по W остальных терминов в том же анкор файле. R. Larson, M. Hearst упоминали подобное.
Зачем это нужно?
затем, что TF нормируется на промежуток от 0 до 1 (или 0,5 -1 ), а IDF нет.
wolf, как вы относитесь к фильтрам на анкор файл? нужны ли они для повышения качества поиска?
Под фильтром понимаю ручной ввод ограничения какого либо параметра, например, если tf=1000,то урезать tf до 100.
понятно. а какова схема исследования?
по собственной теории предсказываете позиции исследуемых сайтов, тем самым подтверждаете или опровергаете предположения?
Нет. Строю аналитическую модель ранжирования на основе данных, полученных с помощью специальным образом построенных запросов.
нормировка W определенного термина в анкор файле по W остальных терминов в том же анкор файле. R. Larson, M. Hearst упоминали подобное.
Зачем это нужно?
затем, что TF нормируется на промежуток от 0 до 1 (или 0,5 -1 ), а IDF нет.
Это не есть нормировка по W, как Вы писали. Это есть нормировка TF по какому либо параметру (например, длине документа или частотности самого частотного термина). IDF, кстати, логарифмируется и тоже загоняется тем самым в довольно небольшой числовой промежуток.
wolf, как вы относитесь к фильтрам на анкор файл? нужны ли они для повышения качества поиска?
А как к ним прикажете относиться? Я могу к ним относиться только как к объективной реальности. Если, она, конечно, существует... :)
Это не есть нормировка по W, как Вы писали. Это есть нормировка TF по какому либо параметру (например, длине документа или частотности самого частотного термина).
изложу мысль подробнее.
Давайте обозначать маленькими буквами НЕ нормированые величины, а большими - нормированные.
tf - не норм-а
TF - норм-а
итд.
W=TF*IDF в документе, а потом нормирование по W во всём анкор файле.
нормировки по w сущесвенно отличаются от нормировок tf и idf.
Нормировки tf
1. tf/tfmax
2. 0.5 + 0.5tf/tfmax
3. логарифмическая
4. по длине, bm25
Нормировки idf
1. log(x)
2. log(x)*log(x) (квадратичная)
3. log(x-1)
4. обратное количество документов с термином
Нормировки w (normw)
1. сумма w
2. sqrt(сумма w*w)
3. сумма w*w*w*w
4. max(w)
суммируется по всем терминам документа
Как не сложно заметить все они отличаются существенно, поэтому я говорю именно о последней, а не об нормировке tf или idf.
А вобщем нормированная величина определяется так (может определяться так, я на данный момент считаю так)
W = TF*IDF/normw
где normw - один из 4ёх видов нормировки w.
IDF, кстати, логарифмируется и тоже загоняется тем самым в довольно небольшой числовой промежуток.
есть нормировка квадрат log, которая может расширить этот промежуток.
А как к ним прикажете относиться? Я могу к ним относиться только как к объективной реальности. Если, она, конечно, существует... :)
относиться можно к ним по-другому.
фильтров нет, это все особенности функции. так все изначально задумано.. ну не важно. понятно вобщем.