vga1

vga1
Рейтинг
251
Регистрация
18.02.2007
Vanzent:
Добавить в search_bad_ads.php в самое начало:
$res = exec('ps -ef | grep '.basename(__FILE__).' | grep -v grep | wc -l');
if ($res > 1)
exit('Script is already running! Exit...');

Это предотвратит запуск скрипта из веба если он уже запущен по крону

Потестируй скрипт с одновременным запуском из веба, и либо сразу, либо по окончанию запустить с консоли. Пользователи запускающие скрипт разные. Если не будет ошибок то повторить сразу еще раз. У меня переодически вылетает скрипт, т.е. в консоли идет куча ошибок, я так понимаю слетает авторизация. Вводишь через веб логин пароль и все снова работает.

Этот код учитывает директорию запуска? У меня ОДНОВРЕМЕННО из нескольких директорий с разными настройками для разных гугле аккаунтов запускается.

xoxol4uk22:
Позвонили из США продитовал робот на английском код)) но не подошло((

Снова попробуйте, у меня подошел код по звонку.

AfterWar:
Комплексно надо, чтобы показов не успевали набрать. Или делать двухэтапную - 1 быстрый по фильтру вышибает основную массу, а затем подключаются точные методы определения. В любом случае список выявляет больше пока у меня в разы чем другие методы...

С двухэтапной согласен. Поиск через фильтр охватывает полную глубина поиска, чем, скажем, перебор от начала только 200 объяв.

UPD: sergeich_gs, можно будет сделать, новый алгоритм подключаемый к основному, а не заменяющий. Типа есть стоит галочка, дополнительный поиск с использованием Фильтра, что чтобы к основному поиску, еще искал по фильтру ЦПО. Или через две галочки (использовать основной поиск и поиск по фильтру ЦПО)? Какая галочка выбрана, тот алгоритм и использовать. если две одновременно, то тот и другой. Но по умолчанию выбран Основной поиск, чтобы для новых пользователей, не разбирающихся в настройках, искал с учетом замен англ./русских букв в слове. А то спамеры на новичках будут выезжать.

sergeich_gs:
По-моему, мешанину уж проще перебором выявлять - менее трудозатратно, чем пытаться подобрать все варианты. А когда регулярно работает, совсем немного объявлений ежечасно появляется.

Главное надежней. Спамеры только и ждут, чтобы пользователи программы отключили поиск вперемешку русских/английских букв в словах.

---------- Добавлено 15.11.2017 в 22:47 ----------

Vanzent:
В фильтре вроде регистронезависимый поиск.

Я не про регистр, а про Е - русская, E - английская. Выделил в примере регистром, чтобы было понятно, о какой букве речь.

---------- Добавлено 15.11.2017 в 22:49 ----------

Vanzent:

Но. Изобретают новые словоформы не часто. Неделю на первом-втором экране не вижу паразитных объяв. А если появятся, значит слово-якорь пойдет в стоплист.

Хотелось бы в cron поставить и следить за сменой словоформ по минимуму.

Vanzent:
В фильтре ЦПО использую слова, которые появляются на первом-втором экране в плохих объявах.
А с перемешкой - мне кажется, что надо составлять массивы похожих букв и делать
preg_replace('/[aàáâãäåĀāĂ㥹ǡ]/','а',$text)

и так для всех схожих ))

У Сергеича это уже сделано, когда включена галка Replace lat2cyr: X.

А если через фильтр ЦПО искать слова, пусть даже программно, то сначала надо члЕн (рус) искать, потом члЕн (англ), члеН (рус), члеH (анг) итого 4 вызова на одно слово.

Сейчас в программе другой алгоритм поиска, он выбирает первое объявление, заменяет все английские буквы на похожие по написанию русские и ищет все слова из стоп листа. Потом выбирает второе объявление и так до максимума объявлений, заданных в настройках. Думаю, у Сергеича быстрее будет работать, с учетом замены англ букв на русские, чем в Вашем алгоритме.

Vanzent:
Это надо в основной версии делать.
Тут тупо - вбил в фильтр, что отфильтровалось, то и заблокировалсь.

В том то и дело, что через ЦПО это практически не возможно сделать. Если мы о словах с русскими/английскими буквами вперемежку говорим.

В ЦПО надо все возможные варианты замен русских/букв перебирать, а это сотни вызовов на одно слово

Vanzent:
Да, по сути просто цикл изменил, да добавил параметр вставки слова в фильтр.
Кому надо - копируете в папку и ставьте в крон. А, еще список слов сделайте свой. Тут

У вас получится искать слова с русскими / английскими буквами в перемежку?

Сергееич, вопрос на подумать :)

Когда нажимаю добавить в белый список, то 100% надо нажать кнопку разблокировать объявление. Может разблокировку на автомате делать при добавлении в белый список?

sergeich_gs, белый лист по всем строкам из одного объявления ищет или по отдельной строке?

Добавилось:

похороны - что нужно делать?
акция
памятники из натурального гранита. собственное производство. низкие цены!

Одно слово 'Акция' в строке смущает

sergeich_gs, плиз, здесь тоже.

<p>ad Whitelisted.<br />
Don't save whitelist before <a href="./" target="_parent">refreshing the page</a>.
</p>

И другое, более важное исправление хочется, ради чего разбиение на 2 экрана (Setting, report) делалось: сделать сразу автоматический рефрешь после поиска, чтобы ссылок 'refreshing the page' вообще не повлялось на экране Report. Возможно?

Всего: 1713