Статья о поведенческом антиспаме

12
mikes
На сайте с 20.02.2006
Offline
106
1795

Дошли руки, перевел статью «Identifying Web Spam with User Behavior Analysis», Tsinghua University, Beijing, 2008. Спасибо китайским исследователям, много полезного делают в области IR. Статья о методах поиска спама при помощи анализа поведения пользователей на сайте.

Могут использоваться следующие критерии:

  • Доля коротких визитов
  • Доля seo-трафика на документ
  • Исходящий трафик с документа
Михаил Сливинский, руководитель службы по работе с вебмастерами, Яндекс
Yetti3
На сайте с 19.10.2010
Offline
105
#1

Йооу, здорово что ты это перевел ;), хотя в целом давно понятна тенденция - рынок меняется и увы слишком быстро))

traffiknew
На сайте с 29.07.2010
Offline
29
#2

Спасибо за перевод :)

F
На сайте с 16.01.2010
Offline
267
#3

Мораль статьи - "Не используйте спам". Но всё равно спасибо за труд :)

P9
На сайте с 03.10.2011
Offline
66
#4

Спасибо за перевод

Про документ, как источник трафика недопонял.

А если на сайте практически нет исходящих ссылок, какой с него трафик

icegoblin
На сайте с 20.12.2011
Offline
9
#5

Премного благдарен )

Xammer2000
На сайте с 10.08.2011
Offline
188
#6

ПОчитаем спасибо, за труд.

codegrad
На сайте с 04.08.2011
Offline
118
#7

Спасибо за перевод!

mikes
На сайте с 20.02.2006
Offline
106
#8
futuristian:
Мораль статьи - "Не используйте спам". Но всё равно спасибо за труд :)

Скорее, как измерять спамность :) Проблема в том, что спам - достаточно тонкое понятие. Равно как булев поиск перерос в ранжированный, так и спам уже сложно оценить шкалой [0;1].

Я уже давно был почти уверен в наличии таких технологий (и, кажется, даже рассказывал об этом в Аналитикуме). Приятно было убедиться в разумности предположений :)

Присущ
На сайте с 06.01.2011
Offline
929
#9
mikes:
Скорее, как измерять спамность :) Проблема в том, что спам - достаточно тонкое понятие. Равно как булев поиск перерос в ранжированный, так и спам уже сложно оценить шкалой [0;1].

Я уже давно был почти уверен в наличии таких технологий (и, кажется, даже рассказывал об этом в Аналитикуме). Приятно было убедиться в разумности предположений :)

"Спам - достаточно тонкое понятие." Давно уже определение спамности соотношением массы к количеству упоминаний, дело школьное. Но тех кто хочет оправдать свои неудачи, только предвзятостью и глупостью яндекса вы не убедите. Многим проще искать причины неудач не в собственных знаниях, заблуждениях и ошибках.

Прототипы и юзабилити, чтоб продавал и в топ попал Анализ сложившихся бизнес моделей и поиска точек роста Директ — от 2500 р, включая бюджет на клики / Аудит РК до и после запуска — от 5000 р
[Удален]
#10
Присущ:
Давно уже определение спамности соотношением массы к количеству упоминаний, дело школьное

массы чего? Если Вы про объем текста, то соотношение объема к количеству упоминаний - это обратная плотность. А плотность - не есть определение спамности.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий