sergeich_gs

Рейтинг
160
Регистрация
22.06.2017

Вышла версия 2.2!

Добавлен поисковый фильтр: он позволяет находить замаскированные латинскими буквами слова по списку слов для поиска.

vga1:
По поиску без учета английских и русских букв алгоритм совсем простой.

В общем, да. Сделал, прошу качать версию 2.2.

vga1:
sergeich_gs, мне вот пришлось отрубить эту функцию из-за ложных срабатываний. Много достаточно, в нормальных объявлениях часто неосознанно пользователи, подготавливающие рекламу, ошибаются.
Вот если бы эта функция искала только в рамках слов из стоп-листа (Например, если в стоп листе указан Билана, то перебирала варианты русских - английских только в этом слове), просто было бы здорово. И сильно бы подрезало возможности фантазировать у спамеров. И еще бы в русских словах не только английские, но и юникодые символы, кроме 33 русских букв запретить.

Ну это слишком мудрёно. )

Я думал сделать для этого инструмента список слов-исключений, который бы каждый под себя заполнял.

Есть же поиск смеси русских и латинских букв:

Check disguised — проверка наличия замаскированных латинских символов под русские, чтобы находить подобное: «Maлaхoв yшeл co cкaндaлoм — Стaлa извeстнa пpичинa».

---------- Добавлено 03.11.2017 в 20:04 ----------

Иногда "Мбит" интернет-провайдеров ловятся. Редко.

Kasperaitus:
sergeich_gs, т.е. получается, n-раз подряд будет обращение к одним и тем же объявлениям (если проверяем уже просмотренные)? Какой смысл?

Не, когда смотрим уже проверенные, то каждый последующий запуск из цикла проверяет следующие "2х70". Таким образом можно проверить 140 объявлений n раз (то есть хоть все) одним нажатием, как верно подметил vga1, не волнуясь, что исполнение обрубится, например, на 30-ой секунде.

vga1:
Я так понял, это из-за вылета по таймауту сделано. Иначе можно было бы указать 4 страницы по 70 объявлений - тоже самое по сути.

Точно. Не у всех есть возможность расширять время исполнения, не раз видел ошибки, где явно видно, что заблокирована возможность расширить время исполнения.

Kasperaitus:
А можно чуть подробнее, как это работает?
Например, в ранних версиях я ставил 2 страницы по 70 объяв. Что будет, если теперь укажу n-циклов?

Да, напишу в инструкции, пока недобраться.

Вкратце если,то будет две страницы по 70 объяв n раз.

При запуске соответствующей кнопкой.

nikdiv:
sergeich_gs,

У меня вот такие крякозябры. В папке логов ничего нет, права на ней 777 стоят.

Знакомо дело.

Debug нажмите и там галку utf8_decode или что-то такое поставьте/снимите.

callidus:
Ну и неплохо бы показывать текущую версию скрипта

Сделал. В следующем выпуске будет. Предыдущие неохота перелопачивать.

Не так давно при очередной доработке сломал механизм фильтрации и один из биланов 250 просмотров набрал за ночь.

Norbis:
Я уже было подумал что скрипт - панацея, начал разбираться и настраивать, но ... это как "сапожник без сапог", простите.

Хотя этот скрипт для отлова - отличная идея.

Подставили биланы! )))

Не, не панацея, специально сделал на заблокированных сбор статистики. Интересно просто сколько раз они успевают показаться между началом показов и попаданием в ЦПО для отлова. Здесь 2 раза в час работает отлов. На этом объявлении всего 4 показа было. 25% показов Вы отсмотрели. )

png srcpi.png
Всего: 1119