- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
VK приобрела 70% в структуре компании-разработчика red_mad_robot
Которая участвовала в создании RuStore
Оксана Мамчуева
Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
В том то и дело, что через ЦПО это практически не возможно сделать. Если мы о словах с русскими/английскими буквами вперемежку говорим.
В ЦПО надо все возможные варианты замен русских/букв перебирать, а это сотни вызовов на одно слово
В фильтре ЦПО использую слова, которые появляются на первом-втором экране в плохих объявах.
А с перемешкой - мне кажется, что надо составлять массивы похожих букв и делать
и так для всех схожих ))
В фильтре ЦПО использую слова, которые появляются на первом-втором экране в плохих объявах.
А с перемешкой - мне кажется, что надо составлять массивы похожих букв и делать
и так для всех схожих ))
У Сергеича это уже сделано, когда включена галка Replace lat2cyr: X.
А если через фильтр ЦПО искать слова, пусть даже программно, то сначала надо члЕн (рус) искать, потом члЕн (англ), члеН (рус), члеH (анг) итого 4 вызова на одно слово.
Сейчас в программе другой алгоритм поиска, он выбирает первое объявление, заменяет все английские буквы на похожие по написанию русские и ищет все слова из стоп листа. Потом выбирает второе объявление и так до максимума объявлений, заданных в настройках. Думаю, у Сергеича быстрее будет работать, с учетом замены англ букв на русские, чем в Вашем алгоритме.
По-моему, мешанину уж проще перебором выявлять - менее трудозатратно, чем пытаться подобрать все варианты. А когда регулярно работает, совсем немного объявлений ежечасно появляется.
Vanzent, можно код в свою версию включить?
У Сергеича это уже сделано, когда включена галка Replace lat2cyr: X.
А если через фильтр ЦПО искать слова, пусть даже программно, то сначала надо члЕн (рус) искать, потом члЕн (англ), члеН (рус), члеH (анг) итого 4 вызова на одно слово.
Сейчас в программе другой алгоритм поиска, он выбирает первое объявление, заменяет все английские буквы на похожие по написанию русские и ищет все слова из стоп листа. Потом выбирает второе объявление и так до максимума объявлений, заданных в настройках. Думаю, у Сергеича быстрее будет работать, с учетом замены англ букв на русские, чем в Вашем алгоритме.
В фильтре вроде регистронезависимый поиск.
Конечно быстрее. Через фильтр столько вариантов не прогонишь.
Но. Изобретают новые словоформы не часто. Неделю на первом-втором экране не вижу паразитных объяв. А если появятся, значит слово-якорь пойдет в стоплист.
sergeich_gs Так да, конечно. Код, собственно, ваш. Подправьте если что не так. Только ник не вставляйте )
По-моему, мешанину уж проще перебором выявлять - менее трудозатратно, чем пытаться подобрать все варианты. А когда регулярно работает, совсем немного объявлений ежечасно появляется.
Главное надежней. Спамеры только и ждут, чтобы пользователи программы отключили поиск вперемешку русских/английских букв в словах.
---------- Добавлено 15.11.2017 в 22:47 ----------
В фильтре вроде регистронезависимый поиск.
Я не про регистр, а про Е - русская, E - английская. Выделил в примере регистром, чтобы было понятно, о какой букве речь.
---------- Добавлено 15.11.2017 в 22:49 ----------
Но. Изобретают новые словоформы не часто. Неделю на первом-втором экране не вижу паразитных объяв. А если появятся, значит слово-якорь пойдет в стоплист.
Хотелось бы в cron поставить и следить за сменой словоформ по минимуму.
Комплексно надо, чтобы показов не успевали набрать. Или делать двухэтапную - 1 быстрый по фильтру вышибает основную массу, а затем подключаются точные методы определения. В любом случае список выявляет больше пока у меня в разы чем другие методы...
Комплексно надо, чтобы показов не успевали набрать. Или делать двухэтапную - 1 быстрый по фильтру вышибает основную массу, а затем подключаются точные методы определения. В любом случае список выявляет больше пока у меня в разы чем другие методы...
С двухэтапной согласен. Поиск через фильтр охватывает полную глубина поиска, чем, скажем, перебор от начала только 200 объяв.
UPD: sergeich_gs, можно будет сделать, новый алгоритм подключаемый к основному, а не заменяющий. Типа есть стоит галочка, дополнительный поиск с использованием Фильтра, что чтобы к основному поиску, еще искал по фильтру ЦПО. Или через две галочки (использовать основной поиск и поиск по фильтру ЦПО)? Какая галочка выбрана, тот алгоритм и использовать. если две одновременно, то тот и другой. Но по умолчанию выбран Основной поиск, чтобы для новых пользователей, не разбирающихся в настройках, искал с учетом замен англ./русских букв в слове. А то спамеры на новичках будут выезжать.
У меня при авторизации (вводе пароля) выскакивает поле для СМС кода из 6 цифр. Это что такое?
---------- Добавлено 16.11.2017 в 01:16 ----------
У меня при авторизации (вводе пароля) выскакивает поле для СМС кода из 6 цифр. Это что такое?
Извините, я просто читать не умею((
---------- Добавлено 16.11.2017 в 01:25 ----------
Но так и не пришло СМС ни разу ((
---------- Добавлено 16.11.2017 в 01:54 ----------
Позвонили из США продитовал робот на английском код)) но не подошло((
Вчера и сегодня пробовал с разных хостингов и серверов. Та же проблема:
Notice: Undefined variable: forms in .../login_functions.php on line 270
Установил Open Server на комп. Все замечательно работает. Проблема с аутентификацией отпала.
Очень полезная вещь. Низкий поклон всем кто работал и работает над скриптом.
Уже реализовано. Надо включить Check target URL — проверка на наличие «плохих» слов в целевом URL (не путать с отображаемым).
Обязательно включите эту галку, а в список для текстовых добавьте это
.site
.pw
.top
.xyz
.online
.website
.space
найдет еще нереальную тонну шлака :)))