Блокировщик "Биланов-стояков" в AdSense на php

SG
На сайте с 22.06.2017
Offline
160
#141
Vanzent:
*/10 * * * * www-data /usr/bin/php ./search_bad_ads.php

Абсолютный же путь нужно указывать?

Да, насколько знаю.

Не исключаю, что для определённых пользователей будут работать и относительные. Ваш www-data, например, не видит что выше, возможно и так сработает, но не проверял.

---------- Добавлено 06.11.2017 в 16:46 ----------

iq2003:
sergeich_gs, а если я не шарю совсем в пхп, кронах и прочем, смогу я настроить вашу прогу по инструкции?

или лучше не начинать? :) вообще для новичка в этом деле это реально?

Ну как, получилось?

php-клиент AdSense для поиска объявлений с блокировкой по ключевым словам и не только: Bad ads Blocker (https://www.howgadget.com/adsense/kak-zablokirovat-musornye-obyavleniya-v-adsense.html#download) Заблокированные домены (https://www.howgadget.com/bad_ads_blocker/domains/)
AfterWar
На сайте с 28.01.2013
Offline
174
#142
sergeich_gs:
Неосилил. Собрал проект, но либо ошибки выдаёт либо молча не работает.
Там, кажись, DOM нету. В списке модулей не увидел. Может из-за этого и не работает. Ещё он HTTP_REFERER не знает.

А под xampp файлы-то создаются?

cookie.txt не создается. Вручную создаешь warn пропадает , но все равно не коннектится...Логи тоже не создаются хотя галочка стоит... Настройки запоминает...

dllки php шные кидал в системные папки - результата 0.

⭐⭐⭐ЛУЧШАЯ АЛЬТЕРНАТИВА ADSENSE (ПЛАТЯТ, И ДЛЯ RU ДЛЯ БУРЖ) ( https://clck.ru/KgyqY )
SG
На сайте с 22.06.2017
Offline
160
#143
AfterWar:
cookie.txt не создается. Вручную создаешь warn пропадает , но все равно не коннектится...Логи тоже не создаются хотя галочка стоит... Настройки запоминает...
dllки php шные кидал в системные папки - результата 0.

Это похоже на то, что curl не работает.

Ну или работает неправильно. Где-то видел, что он включенпо phpinfo, вроде всё нормально, а фактически не работает.

AfterWar
На сайте с 28.01.2013
Offline
174
#144

Сегодня у кума попробую на win32 - а то ни у кого их уже не осталось в округе... на stackoverflow было такое что на 32 работае а на 64 нет

Кстати тестовый curl работает - коннектится и к https://ya.ru

SG
На сайте с 22.06.2017
Offline
160
#145
AfterWar:
Сегодня у кума попробую на win32 - а то ни у кого их уже не осталось в округе... на stackoverflow было такое что на 32 работае а на 64 нет

Кстати тестовый curl работает - коннектится и к https://ya.ru

Да, интересный случай...

Я гуглил, пытался понять, но однозначного ответа не нашёл чем его так x64 не устраивает.

Возможно, какая-то настройка его с толку сбивает.

А файлы пишутся/читаются? А то без этого тоже работать не будет.

K1
На сайте с 03.12.2010
Offline
115
#146

Было бы неплохо добавить возможность включения фильтра "Объявления, впервые показанные на вашем сайте: Последние 3 дня", чтобы проверялись новые объявления.

O
На сайте с 28.07.2009
Offline
131
#147

Во-первых, хочу поблагодарить, как минимум, идея отличная. Только начал разбираться.

В качестве предложения к дополнению документации могу предложить отключать перекодирование в UTF-8 тем, у кого хостинг нормальный, на UTF-8, это большинство, я думаю.

Возможно, что потребуется устанавливать локаль, чтобы нормально работала русская кодировка. Возможно, что это можно вынести в опции. Я, например, перед запуском поиска делаю

export LC_ALL=ru_RU.UTF-8

это на всякий случай, просто на косяки поиска по русским буквам при неправильных локалях я уже налетал

Извините, но есть вопросы,

первый - в фильтре по Bad words иногда невозможно определить причину бана

таких объявлений много...

Второй вопрос. Насколько оправдан бан по редиректу? Я его включил и теперь ломаю голову, с одной стороны уж больно много мусора улетает, с другой - достаточно много GEO-зависимых сайтов редиректят. И отключать не хочется, и вижу в списке зря забаненное (например, стоит объява на сайт.ру/russian/, что в итоге редиректит на корень)

Для себя сделал вывод, что лучший вариант - пускать сначала в вебе, настраивать и смотреть, как оно работает, после чего убирать в сторону, недоступную извне и пускать в кроне. Иногда вытаскиваю, смотрю списки забаненных в вебе. Пускаю в кроне 15,30,45 минут каждого часа без просмотра просмотренных и в 0 - с просмотром (чтобы банить подмененные).

Да, доход, как минимум, не упал, при том, что Биланы и прочие каменные беспокоить перестали.

занимаюсь автоматизацией торговли (http://olegon.ru)
SG
На сайте с 22.06.2017
Offline
160
#148
Kenguru111:
Было бы неплохо добавить возможность включения фильтра "Объявления, впервые показанные на вашем сайте: Последние 3 дня", чтобы проверялись новые объявления.

Гляну.

olegon:
В качестве предложения к дополнению документации могу предложить отключать перекодирование в UTF-8 тем, у кого хостинг нормальный, на UTF-8, это большинство, я думаю.

Так оно ж есть уже, под DEbug спрятано.

olegon:
первый - в фильтре по Bad words иногда невозможно определить причину бана
таких объявлений много...

Это в средней колонке? Если да, то так быть не должно это косяк какой-то...

заглянул код - вроде всё в порядке.

Или где это? Под каким заголовком?

olegon:
Второй вопрос. Насколько оправдан бан по редиректу? Я его включил и теперь ломаю голову, с одной стороны уж больно много мусора улетает, с другой - достаточно много GEO-зависимых сайтов редиректят. И отключать не хочется, и вижу в списке зря забаненное (например, стоит объява на сайт.ру/russian/, что в итоге редиректит на корень)

Ну, насколько актуально - смотрите сами.

Опытным путём выяснил, что биланы со стояками на начальных этапах работают без переадресаций (может не все, но многие), поэтому фильтр актуален в начале чистки, когда большую часть можно им отловить, а потом, когда непросмотренные текстовые где-то раз в час появляются можно выключать.

Я, конечно, старался, но фильтр всё ещё кривовато работает, а так же не справляется с доменами РФ и прочими punycode-зависимыми.

olegon:
Для себя сделал вывод, что лучший вариант - пускать сначала в вебе, настраивать и смотреть, как оно работает, после чего убирать в сторону, недоступную извне и пускать в кроне. Иногда вытаскиваю, смотрю списки забаненных в вебе. Пускаю в кроне 15,30,45 минут каждого часа без просмотра просмотренных и в 0 - с просмотром (чтобы банить подмененные).

И у меня примерно так же, только чаще.

И список проверки просмотренных до 200 переопределён:

search_bad_ads.php 1 100 2

---------- Добавлено 06.11.2017 в 22:34 ----------

Да, забыл добавить. Скоро белый список будет, можно им исправлять излишнюю блокировку нормальных.

O
На сайте с 28.07.2009
Offline
131
#149
sergeich_gs:
Так оно ж есть уже, под DEbug спрятано.

Да, я знаю, что есть. Вот оно по умолчанию включено, а, думаю, на большинстве хостингов Linux и UTF8.

sergeich_gs:
Это в средней колонке? Если да, то так быть не должно это косяк какой-то...
заглянул код - вроде всё в порядке.
Или где это? Под каким заголовком?

Именно в средней колонке, жаль, не зацепил сразу, в общем, в этой же колонке идут Bad words, просто где-то они указаны, а где-то нет. Идея родилась только что. Там как перечисляется список? Кто переносом строки? Учитывается ли, что сравниваемая строка не может быть меньше 2х символов, например? Я все на Linux держу, возможно, что где-то проблемы разных платформ вылезли. Смущает только, что blocked вообще нет. И, судя по всему, в эту колонку вообще все текстовые объявления полетели



---------- Добавлено 06.11.2017 в 22:51 ----------

там вообще span class='stopword' нет.

---------- Добавлено 06.11.2017 в 22:53 ----------

Кстати, Show block/unblock buttons снята, а кнопки есть, если про Ad/Acc речь...

SG
На сайте с 22.06.2017
Offline
160
#150
olegon:
Да, я знаю, что есть. Вот оно по умолчанию включено, а, думаю, на большинстве хостингов Linux и UTF8.

Думал не заметили, извините. ) Не хочу с этим возиться, пускай так будет, поставить галку не сложно. У самого linux и utf 8, но почему-то приходится преобразовывать.

olegon:
Там как перечисляется список? Кто переносом строки? Учитывается ли, что сравниваемая строка не может быть меньше 2х символов, например? Я все на Linux держу, возможно, что где-то проблемы разных платформ вылезли. Смущает только, что blocked вообще нет. И, судя по всему, в эту колонку вообще все текстовые объявления полетели

Про меньше двух - не учитывается, но и строк таких ещё не было.

А в правой колонке есть что-нибудь?

На картинке у Вас ни одного текстового - все медийные (справа от ссылки подписано).

А почему последнее неправильно - тоже непонятно, теоретически тоже должно было преобразоваться в русский.

olegon:
там вообще span class='stopword' нет.

Да, это странно и, теоретически, невозможно. ) В общем, пока не знаю - буду думать.

olegon:
Кстати, Show block/unblock buttons снята, а кнопки есть, если про Ad/Acc речь...

Это про маловостребованные кнопки. Если поставите галку, то будет по 4 кнопки.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий