В основном подписки на платные игры и пр. дрянь
n.nu
mego-restik.ru
merfection.ru
looking4fun.mobi
bounce.mobi
funtasy.mobi
mobileservice.mobi
gameplaneet.mobi
igames-mobi.com
landing-page.mobi
get-libr.ru
chillaxgames.mobi
top100games.mobi
не добавляется в блокировки как домен верхнего уровня, но тут сплошной мусор
cloudfront.net
поиск мобильного
goandfind.mobi
geoloc.mobi (€39,99 в месяц.)
Всякая иностранная дрянь и подписки ( оказывается например в Польше тоже подобная дрянь существует, пример: http://www.gameasy.pl/subscribe/?cr=97033 , хотя бы прямым текстом написано ):
asokwebs.icu
ac-leiexcl.fun
fun-xtream.com
play-fun.mobi
gamifive.fun
eco-timedrob.fun
done-meplanner.fun
fun-universe.mobi
kahkah-fun.com
gameasy.pl
leyealink.com
ameterapart.com
oggipremio.com
vindercentralen.com
chooseurself.com
getyourprizenow.com
ponleunasonrisa.com---------- Добавлено 03.05.2019 в 13:29 ----------powiadomienie.com---------- Добавлено 03.05.2019 в 13:39 ----------lucky-today.com
rabiosadeal.com
sonhaeganha.com
Простой вариант, создать набор метрик объявления - например дать условный вес (вероятность использования данного слова в плохом объявлении основываясь на статистике уже заблокированных объявлений) каждому значимому слову. Неизвестные слова тоже наделить таким весом, слова в которых спутана кириллица и латиница соотв. тоже. К метрикам можно добавить любые характеристики по которым имеется хоть какое-то отличие нормальных и плохих объявлений, например зона домена и пр.
Когда будет набор таких метрик, то мы можем применить их к объявлению.
Пример, допустим мы имеем набор метрик основанных на статистике:
url: ( имеет редирект/содержит слово/доменная зона/дата регистрации домена и т.п. ) - вероятность 0.5 (каждый из перечисленных пунктов скорее будет иметь разный вес)
в тексте слова смешаны кириллица и латиница - вероятность 0.6
россияне: 0.4
муж: 0.7
оказывается: 0.3
имеем объявление:
Россияне, оказывается есть возможность ..
http://yyyyy.surf
считаем суммарный вес сработанных метрик, выходит
0.4, 0.3, 0.5 посчитаем вероятность того, что это плохое объявление:
1 - 0.6 * 0.7 * 0.5 = 0.79
выставляем планку вероятности скажем в 0.75 и все кто ее набирает уходит в заблокированные.
Домены в блэк почти не добавляю только агрегаторы вроде myflexbe.com tilda.ws nethouse.ru блочу аккаунты, объявы и репорт о нарушении. Ну и блокировщик стоит с проверкой самых новых объявлений в котором стоп-слова довольно жесткие (+ фразы) вроде муж, жена и т.п. без добавления в проверенные т.к. нафиг проверять два списка (вылавливать перевертыши), так то стало заметно меньше г. объявлений с наплывыми временами.
2-3 просмотра это конечно смотря какой сайт. В центр просмотра, объявления выгружаются порциями (видимо по времени) и пока это порция копится показы идут и исчисляться могут тысячами. Но блокировщик ставить надо согласен, хотя бы самые мерзкие объявы блокируются. Но необъходимость проверять вручную никуда не девается, т.к. и сочетания слов в объявлениях меняются и медийка без слов есть и перевертыши тоже.
По мне блокировщик надо делать по эвристике а не по вхождению фраз, т.е. чтобы высчитывалась вероятность того, что объявление надо блокировать, пусть будут промахи, но это лучше нежели живые упоротые объявы вроде "4лен мy#a, стал как у коня, он д0лбит мня сymками"
Жирно ( у меня ):
surf
Такая же фигня, в проверенные не добавляю и скрипт не добавляет. А они там оказываются, такое ощущение, что вместо того чтобы забанить объявы уходят в проверенные.
Фильтруйте сами или кто-то это должен делать? Кто-то нашел у себя в активных г-рекламу выложил или ему может перечитать все что до этого было написано? Спасибо большое на этом.
bjnewlife
seinrec
abliset
fast-skills
mapcoasv
lamattarana
asrend
dekiljo
fairycake
zunna.moonfruit