Блокировщик "Биланов-стояков" в AdSense на php

V
На сайте с 07.09.2011
Offline
113
#281
vga1:
В том то и дело, что через ЦПО это практически не возможно сделать. Если мы о словах с русскими/английскими буквами вперемежку говорим.
В ЦПО надо все возможные варианты замен русских/букв перебирать, а это сотни вызовов на одно слово

В фильтре ЦПО использую слова, которые появляются на первом-втором экране в плохих объявах.

А с перемешкой - мне кажется, что надо составлять массивы похожих букв и делать

preg_replace('/[aàáâãäåĀāĂ㥹ǡ]/','а',$text)

и так для всех схожих ))

vga1
На сайте с 18.02.2007
Offline
251
#282
Vanzent:
В фильтре ЦПО использую слова, которые появляются на первом-втором экране в плохих объявах.
А с перемешкой - мне кажется, что надо составлять массивы похожих букв и делать
preg_replace('/[aàáâãäåĀāĂ㥹ǡ]/','а',$text)

и так для всех схожих ))

У Сергеича это уже сделано, когда включена галка Replace lat2cyr: X.

А если через фильтр ЦПО искать слова, пусть даже программно, то сначала надо члЕн (рус) искать, потом члЕн (англ), члеН (рус), члеH (анг) итого 4 вызова на одно слово.

Сейчас в программе другой алгоритм поиска, он выбирает первое объявление, заменяет все английские буквы на похожие по написанию русские и ищет все слова из стоп листа. Потом выбирает второе объявление и так до максимума объявлений, заданных в настройках. Думаю, у Сергеича быстрее будет работать, с учетом замены англ букв на русские, чем в Вашем алгоритме.

SG
На сайте с 22.06.2017
Offline
160
#283

По-моему, мешанину уж проще перебором выявлять - менее трудозатратно, чем пытаться подобрать все варианты. А когда регулярно работает, совсем немного объявлений ежечасно появляется.

Vanzent, можно код в свою версию включить?

php-клиент AdSense для поиска объявлений с блокировкой по ключевым словам и не только: Bad ads Blocker (https://www.howgadget.com/adsense/kak-zablokirovat-musornye-obyavleniya-v-adsense.html#download) Заблокированные домены (https://www.howgadget.com/bad_ads_blocker/domains/)
V
На сайте с 07.09.2011
Offline
113
#284
vga1:
У Сергеича это уже сделано, когда включена галка Replace lat2cyr: X.
А если через фильтр ЦПО искать слова, пусть даже программно, то сначала надо члЕн (рус) искать, потом члЕн (англ), члеН (рус), члеH (анг) итого 4 вызова на одно слово.

Сейчас в программе другой алгоритм поиска, он выбирает первое объявление, заменяет все английские буквы на похожие по написанию русские и ищет все слова из стоп листа. Потом выбирает второе объявление и так до максимума объявлений, заданных в настройках. Думаю, у Сергеича быстрее будет работать, с учетом замены англ букв на русские, чем в Вашем алгоритме.

В фильтре вроде регистронезависимый поиск.

Конечно быстрее. Через фильтр столько вариантов не прогонишь.

Но. Изобретают новые словоформы не часто. Неделю на первом-втором экране не вижу паразитных объяв. А если появятся, значит слово-якорь пойдет в стоплист.

sergeich_gs Так да, конечно. Код, собственно, ваш. Подправьте если что не так. Только ник не вставляйте )

vga1
На сайте с 18.02.2007
Offline
251
#285
sergeich_gs:
По-моему, мешанину уж проще перебором выявлять - менее трудозатратно, чем пытаться подобрать все варианты. А когда регулярно работает, совсем немного объявлений ежечасно появляется.

Главное надежней. Спамеры только и ждут, чтобы пользователи программы отключили поиск вперемешку русских/английских букв в словах.

---------- Добавлено 15.11.2017 в 22:47 ----------

Vanzent:
В фильтре вроде регистронезависимый поиск.

Я не про регистр, а про Е - русская, E - английская. Выделил в примере регистром, чтобы было понятно, о какой букве речь.

---------- Добавлено 15.11.2017 в 22:49 ----------

Vanzent:

Но. Изобретают новые словоформы не часто. Неделю на первом-втором экране не вижу паразитных объяв. А если появятся, значит слово-якорь пойдет в стоплист.

Хотелось бы в cron поставить и следить за сменой словоформ по минимуму.

AfterWar
На сайте с 28.01.2013
Offline
169
#286

Комплексно надо, чтобы показов не успевали набрать. Или делать двухэтапную - 1 быстрый по фильтру вышибает основную массу, а затем подключаются точные методы определения. В любом случае список выявляет больше пока у меня в разы чем другие методы...

⭐⭐⭐ЛУЧШАЯ АЛЬТЕРНАТИВА ADSENSE (ПЛАТЯТ, И ДЛЯ RU ДЛЯ БУРЖ) ( https://clck.ru/KgyqY )
vga1
На сайте с 18.02.2007
Offline
251
#287
AfterWar:
Комплексно надо, чтобы показов не успевали набрать. Или делать двухэтапную - 1 быстрый по фильтру вышибает основную массу, а затем подключаются точные методы определения. В любом случае список выявляет больше пока у меня в разы чем другие методы...

С двухэтапной согласен. Поиск через фильтр охватывает полную глубина поиска, чем, скажем, перебор от начала только 200 объяв.

UPD: sergeich_gs, можно будет сделать, новый алгоритм подключаемый к основному, а не заменяющий. Типа есть стоит галочка, дополнительный поиск с использованием Фильтра, что чтобы к основному поиску, еще искал по фильтру ЦПО. Или через две галочки (использовать основной поиск и поиск по фильтру ЦПО)? Какая галочка выбрана, тот алгоритм и использовать. если две одновременно, то тот и другой. Но по умолчанию выбран Основной поиск, чтобы для новых пользователей, не разбирающихся в настройках, искал с учетом замен англ./русских букв в слове. А то спамеры на новичках будут выезжать.

xoxol4uk22
На сайте с 14.11.2017
Offline
66
#288

У меня при авторизации (вводе пароля) выскакивает поле для СМС кода из 6 цифр. Это что такое?

---------- Добавлено 16.11.2017 в 01:16 ----------

xoxol4uk22:
У меня при авторизации (вводе пароля) выскакивает поле для СМС кода из 6 цифр. Это что такое?

Извините, я просто читать не умею((

---------- Добавлено 16.11.2017 в 01:25 ----------

Но так и не пришло СМС ни разу ((

---------- Добавлено 16.11.2017 в 01:54 ----------

Позвонили из США продитовал робот на английском код)) но не подошло((

ein_sof
На сайте с 20.01.2017
Offline
66
#289
ein_sof:
Вчера и сегодня пробовал с разных хостингов и серверов. Та же проблема:

Notice: Undefined variable: forms in .../login_functions.php on line 270

Установил Open Server на комп. Все замечательно работает. Проблема с аутентификацией отпала.

Очень полезная вещь. Низкий поклон всем кто работал и работает над скриптом.

D
На сайте с 28.06.2008
Offline
1101
#290
sergeich_gs:
Уже реализовано. Надо включить Check target URL — проверка на наличие «плохих» слов в целевом URL (не путать с отображаемым).

Обязательно включите эту галку, а в список для текстовых добавьте это

.bid
.site
.pw
.top
.xyz
.online
.website
.space

найдет еще нереальную тонну шлака :)))

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий