Как определяется продажность ссылок. Конспект одного исследования.

123 4
R
На сайте с 25.07.2009
Offline
114
4940

Данное исследование было проведено в Муромском институте (филиале) Владимирского государственного университета. Здесь представлено краткое его содержание с самыми интересными моментами. Кое-где присутствуют мои заметки и выводы.

Введение рассказывает нам о объемах продажи ссылок на биржах Sape.ru, MainLink.ru, Xap.ru, Link-Feed.ru, SetLinks.ru, Clx.ru.

Целью является изучение различных характеристик продажных ссылок. А также использование этих данных для выявления этих ссылок.

Исходные данные:

Рассматривается 10 сайтов с общим числом страниц около 5000. Они ежедневно мониторились в течение 7 месяцев. Каждый день на сайтах размещалось 5500 ссылок. В это же время сканировались естественные ссылки на этих сайтах.

Ротация ссылок

Ротация ссылок за 7 месяцев:

где Кr – коэффициент ротации ссылок;

L1 – число ссылок, размещенных в данный момент;

L7 – общее число ссылок, размещенных за 7 месяц наблюдений.

Ротация ссылок за 1 месяц:

Krm – коэффициент ротации ссылок за 1 месяц.

После всех проведенных расчетов получилась таблица:

Далее исследовалась ротация естественных ссылок - Kr_n. Рассчитывалась она аналогично Kr. У всех сайтов этот параметр не превысил 0,01, а у большинства вообще был равным нулю.

Ротация естественных ссылок за 1 месяц не превысил 0,002. Смотрим в таблицу и сравниваем.

Получается, большинство естественных ссылок не меняется или меняется на уровне погрешности.

Далее была проверена ротация естественных ссылок на сайтах с динамическим контентом – форумы, блоги, новостные сайты и т.п. Krm_n для них равнялся 0,05.

Получается уже теперь можно с большой вероятностью определить продажность ссылок. При коэффициенте ротации выше 0,1 ссылку можно считать продажной.

Кроме этого, можно считать ротацию в определенных местах сайта. Например, если ссылка в подвале мигает, а в теле сайта остается неизменной, то можно сделать вывод что подвальная ссылка не естественная.

Вывод: продажные ссылки вычислить очень легко. Кроме того, это всего лишь один из параметров, который можно использовать. Но такие ссылки все равно работают. Представители Яндекса уже не раз заявляют о снижении влияния продажных ссылок. Видимо, они отключают это влияние потихоньку, чтобы не было неразберихи в выдаче. Вполне вероятно, что при снижении влияния этих ссылок алгоритм MatrixNet обучается ранжировать сайты без «отрезанной» части влияния ссылок.

Но в тоже время сложно выявить продажные ссылки, которые продаются «навсегда». Также это не должно коснуться ссылок с каталогов, пресс-релизников, досок объявлений и т.п. Такие ссылки работают и теперь, просто сложно найти хорошего донора, т.к. развелось очень много ликопомоек.

Стремимся к вечным ссылкам: рабочие каталоги, релизники, доски объявлений. Также можно купить ссылки, которые очень будут похожи на естественные.

Тематическая близость ссылок

Здесь тематическая ссылка – это ссылка, у которой тематика совпадает и близка к тематике странице, где она размещена.

Тематика определялась по методике, описанной в литературе [10].

Тематических ссылок (Т) среди продажных L1 (5476) обнаружено всего 242. Потом был определен процент тематических ссылок Tlink по формуле:

Результаты в таблице:

Получается, что только 1 из 22 продажных ссылок имеет тематику.

У естественных ссылок этот показатель (Tlink_n) был равным 80%. Но для сайтов, у которых есть каталог, показатель заметно снижался. Если каталог большой, то тематичность ссылок была менее 1 процента.

Заметка: естественны ли ссылки в каталогах – это еще спорный вопрос… Смотря какой каталог. Если это ЯК, то вопросов не возникает. А если немодерируемый ГС-каталог, то о естественности говорить не приходится.

В исследовании делается вывод о том, что тематичность нельзя использовать для выявления продажных ссылок как самостоятельный фактор. Однако его можно использовать в совокупности с другими параметрами.

Вывод: стараемся добывать ссылки с тематически-близких ресурсов. Плюс к этому избираем ротации.

P.S. Вспоминаем доклад Яндекса в Мадриде об определении продажных ссылок на основе тематичности.

Тематика ссылок в блоке

Это самые обыкновенные биржевые ссылки, которые вебмастер размещает в блоке.

Исследование этого параметра нижу в таблице:

Кроме того, что ссылки отличаются от тематики страницы, они еще отличаются по тематике и между собой в блоке.

Вывод: в дополнение всему предыдущему стараемся избегать блочности ссылок.

Время жизни покупных ссылок

Это время от простановки ссылки на сайте до момента ее снятия. В исследовании обозначено как Dlink. Если ссылка пропадала более чем на 10 суток, она считалась удаленной.

Посмотрим как распределилось время жизни ссылок на протяжении года:

Единичные ссылки проживают до конца года.

Ниже время жизни ссылок в процентах, разбитое на месяцы.

Как видно, уже через 2 месяца половина ссылок пропадает. А через пол года исчезает 90% продажных ссылок.

Также, если ваша ссылка стоит долгое время, но вокруг нее мигают другие ссылки в блоке, то вашу ссылку тоже можно заподозрить.

Dlink_n – время жизни естественных ссылок близко к времени жизни страницы, на который стоит ссылка.

Получается, что ссылки, которым менее 6 месяц можно растеривать как продажные.

Вывод: нужно стараться получать «вечные» ссылки. При этом арендованные ссылки не снимать без резких на то причин.

Блуждание ссылок по сайту

Под этим понятием здесь понимается исчезновение ссылки с одной страницы и появление на другой.

Было зафиксировано всего 3 таких перемещения среди покупных ссылок. При перемещении основного контента страницы, ссылка не перемещается. Она привязана к конкретной странице.

В это время естественные ссылки перемещаются вместе с перемещением основного контента страницы.

Анализ динамических характеристик

Для этой цели использовался метод опорных векторов [11]. До этого исследовались только статические признаки. Сейчас к нем еще добавлены признаки, описывающие динамические характеристики:

• коэффициент ротации ссылок на сайте;

• коэффициент ротации ссылок на странице;

• время жизни ссылки на странице;

• время жизни ссылок на сайте;

• время жизни исследуемой ссылки;

• показатель перемещения ссылки по сайту.

Для анализа качества алгоритма были использованы метрики:

Значение этих метрик:

Если сравнить эти данные с прошлыми годами [9] и [11], то заметно улучшение всех метрик. Получается, что распознавать факт продажности ссылок можно еще точнее.

Также снизились показатели ошибочного отнесения естественных ссылок к покупным.

Заметка: все-таки некоторые естественные ссылки распознаются как продажные…

Выводы

1. У сайтов, продающих ссылки, коэффициент ротации выше 0,1.

2. Тематическую близость к странице имеют менее 5% ссылок.

3. Дольше 6 месяцев доживает всего 10%.

4. Продажные ссылки не перемещаются по сайту вместе с перемещением основного контента страницы.

Последний абзац исследования говорит о том, что динамические характеристики дают возможность добиться полноты обнаружения продажных ссылок 92% с точностью 96%.

Оригинал краткого содержания на моем блоге

Оригинал самого исследования


Мои выводы на текущий момент:

Здесь рассмотрено всего несколько параметров, по которым можно определить продажные ссылки. Думаю, что у поисковых систем их гораздо больше.

Поисковики постепенно уменьшают влияние продажных ссылок. Скорее всего, эта тенденция сохранится. В то же время можно покупать ссылки, которые становится очень сложно определить как продажные.

Если верить данному исследованию, то в будущем будут рулить условно вечные ссылки. В принципе, они уже неплохо рулят

Оказываю услуги по съему санкций Google (/ru/forum/943387)
ДН
На сайте с 17.05.2010
Offline
13
#1

Вот только где взять реально вечные ссылки? Ну хоть на 2-3 года. Гарантий нет.

моими устами говорит истина
basilic
На сайте с 16.05.2008
Offline
369
#2

ТС, у вас там какие-то дауны в каменты блога пишут. Поставьте антиспам, чтоль.

G00DMAN
На сайте с 19.04.2008
Offline
122
#3
basilic:
ТС, у вас там какие-то дауны в каменты блога пишут. Поставьте антиспам, чтоль.

Ну так какова муромская статья и "выводы" из нее - таковы и комментарии. :)

Илья Зябрев, AlterTrader Research Ltd. Последние статьи: Об отмене ссылок в Яндексе. (www.altertrader.com/publications38.html)|Поведенческие факторы (формулы) (www.altertrader.com/publications36.html) Жадные алгоритмы Яндекса. (www.altertrader.com/publications20.html)|MatrixNet для «чайников». (www.altertrader.com/publications19.html)
Shapranov Pavel
На сайте с 27.08.2007
Offline
304
#4

На самом деле все это очевидно и без исследований, лично мне не столь важно как это все происходит.

9
На сайте с 25.10.2010
Offline
12
#5

Да, работка проделана немалая. А насчет рульности - все давно известно, и какие сайты нужны ПС и какие ссылки - все остальное от лукавого.

Вот только где взять реально вечные ссылки?

Создавать свои сетки сайтов.

Ручная регистрация в трастовых сайтах. (/ru/forum/comment/8131187)
asto
На сайте с 13.10.2005
Offline
180
#6
Создавать свои сетки сайтов.

Угу. Только дело это не такое простое, как кажется с первого взгляда:) Уберегать сетку от бана и пристального взора конкурента:D

Chessmaster
На сайте с 28.12.2006
Offline
257
#7
Если верить данному исследованию

Для чего весь этот бред?? Если бы хотели давно бы отключили ссылки. Что полезного в вашем исследовании?

Просто сидишь и ждешь? Чуда не будет. Учись зарабатывать. Некоторые монеты вырастут в цене в 10 раз. Удачи! https://kriptovalyta.ru
S2
На сайте с 07.01.2008
Offline
611
#8

Достаточно интересно. Полезно, то что видно сразу как это можно обойти. И дело не в отключении ссылок, а в том чтобы передача веса ссылкой не срезалась фильтрами.

Не надо приписывать мне свои выводы, я имею ввиду только то, что написал. Лучшая партнёрка по футболкам/толстовкам (http://partnerka.kolorado.ru/?ref=1921540) Опрос: Проверить текст на уник - как? (/ru/forum/495885)
[Удален]
#9

Что то очень много теоретиков появилось с большим количеством свободного времени.

К чему все это исследование? дешевая популярность, популяризация вечных ссылок среди школьников?

cscope
На сайте с 13.02.2005
Offline
525
#10
9fars:

Создавать свои сетки сайтов.

Только, если в продвижении есть не менее 10-15 сайтов, иначе нет смысла.

asto:
Угу. Только дело это не такое простое, как кажется с первого взгляда:) Уберегать сетку от бана и пристального взора конкурента:D

Закрыть от всех ПС, кроме Яндекса. А на счет бана, да, это самое сложное...

123 4

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий