Фильтрация рассылок на Яндекс.Почте

F
На сайте с 15.11.2000
Offline
116
1714

Яндекс реализовал в Яндекс.Почте фильтрацию рассылок, что позволяет отсеять большинство спамерских писем. Технология используется та же, что и в поисковиках для выявления дубликатов. Насколько мне известно, применен не алгоритм Яндекса, а метод супершинглов и еще несколько приемов, повышающих эффективность отлова. Это в очередной раз доказывает, что поисковые алгоритмы не ограничиваются собственно поиском, но и полезны для обработки больших объемов информации.

С уважением,

Александр Садовский.

P.S.

Лирическое отступление. Данное новшество очень характерно для Яндекса -- компания стремится выжимать из своих наработок все до конца. Этим она чем-то напоминает американскую 3M с их подходом к новаторству. Месяца четыре назад я предложил Илье Сегаловичу идею по фильтрации рассылок, а оказалось, что они уже далеко не первый день ее прорабатывают. Конкуренты только задумываются о том или ином шаге, а в Яндексе проект уже на стадии запуска. За это я и люблю Яндекс. :) Как метко выразился какой-то пользователь, "чувствуется, что Яндекс живой". Возможно, это и стало причиной бурного роста аудитории Яндекса за последний год-два. Ведь некрофилы сейчас редкость, все почему-то любят живых.

Мое отношение к Яндексу:

Я обожаю Яндекс!
26% (5)
Я пользуюсь Яндексом, но глубокой привязанности к нему нет.
47% (9)
Ненавижу Яндекс, но все равно пользуюсь.
5% (1)
Яндекс?! И на версту к нему не подойду!
0% (0)
А что такое Яндекс?
21% (4)
Всего проголосовало: 19
I
На сайте с 15.12.2000
Offline
80
#1
Как писал funsad
отсеять большинство спамерских писем

Саша, не все так радужно, пока удается отсеять примерно около половины. :(

На личном ящике у меня счет 3:0 (то есть 3 отсеялось)

На другом (коллективный, широко известный западным спаммерам) ящике: вчера 4:1, сегодня 3:3.

В причины вдаваться не буду. :)

Кстати, Hotmail это практикует давно - года два, как минимум.

Причем в последние месяцы у них улучшился алгоритм. Раньше отсеивали процентов 30, сецчас около 60. Это я точно знаю, у меня там логин короткий и спама очень (!) много сыпется.

Кстати, мы немного модифицировали супершингл Бройдера, чтобы короткие письма лучше ловить, может еще накропаем статеечку куда-нибудь :)

Илья

vmegap
На сайте с 03.02.2002
Offline
158
#2
Как писал iseg


Кстати, Hotmail это практикует давно - года два, как минимум.

Причем в последние месяцы у них улучшился алгоритм. Раньше отсеивали процентов 30, сецчас около 60. Это я точно знаю, у меня там логин короткий и спама очень (!) много сыпется.

Илья

Я, как заматеревший пользователь Hotmail (несколько десятков ящиков у них было в разное время...), делюсь личными наблюдениями ;)

1. Количество СПАМА в ящике прямо пропорционально длинне адреса. Если еще добавить в имя цифры и пробелы, количество спама резко падает без всяких фильтров. Самый мой удачный в этом смысле хотмейловский адрес начинался так: visit7_40com... . Спама на него приходило от силы 20-30 писем в месяц (фильтры не ставил вообще).

2. Каким-то мифическим способом на количестве спама влияет первая буква адреса. Чем ближе она к концу английского алфавита, тем меньше поток спама в ящике.

3. Хотмейл предлагает несколько степеней фильтрации - по степени возрастания. По моим наблюдениям, легкий фильтр не имеет смысла - отфильтровывают процентов 10, или 20. А высокая степень фильтрации у них недавно стала очень хорошей. Последние недели отфильтровывается практически весь спам, при этом нормальные, действительно мне адресованные письма проходят и не теряются.

С уважением,

Виктор

I
На сайте с 15.12.2000
Offline
80
#3
Как писал vmegap
1. Количество СПАМА в ящике прямо пропорционально длинне адреса.

4 буквы.

Вся почта - 100% спам.

Примерно 70 писем в день.

2. Каким-то мифическим способом на количестве спама влияет первая буква адреса. Чем ближе она к концу английского алфавита, тем меньше поток спама в ящике.

Еще бы. Рассылочные программы построены на обычных БД.

Рассылка идет по алфавиту в 95% случаев.

Повторы детектируются сервером начиная с некоторого порога.

3. Хотмейл предлагает несколько степеней фильтрации/QUOTE]

Я не помню, какую выставлял (средняя?).

Говорю сейчас про соотношение писем в bulk mail к inbox
для моей текущей настройки. Она бесплатная.

Два предыдущих года было 1:2.
Сейчас стало 5:2

Илья
C
На сайте с 22.12.2001
Offline
172
#4

iseg, а если не секрет, когда у Яндекса появится сервис почтовых рассылок?

С уважением, Александр Евдокимов.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий