- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Есть ru-сайт куда материалы добавляются пользователями.
Несколько раз приходилось чистить довольно неприятный контент - какие-то военные приборы пытались рекламировать, один раз секс-товары.
Как можно автоматизировать поиск опасного контента?
Чтобы софт проверял наличие по новым страницам, или тупо обходил сайт по расписанию и выявлял те же порнокартинки, тексты о товарах для секса.
Автомодератор - мечта любого владельца форума :) Но на деле автоматически модерировать можно только спам, да и то с разным процентом успеха. Особенно во время развития таких продуктов как Хрумер. Если обложиться капчами, безусловно будет потеря и нормальных посетителей. Плагины цензуры (по словам и ссылкам) тоже дадут не полный эффект, как и блокировка по айпи. Например, если вас намеренно захотят подставить, то обойдут все эти ограничения. Поэтому без ручной модерации все равно не обойтись. Однако, некий комплекс мер принять можно.
Но чтобы советовать что-то конкретное, уточните что у вас за cms. Т.к. в любом случае это будет реализовываться на ее стороне.
CMS самописная,
задача модерировать тексты еще более-менее ясна, по совпадениям слов и фраз,
а вот что с фото делать, грузят массой и неудобно проверять :(
CMS самописная,
задача модерировать тексты еще более-менее ясна, по совпадениям слов и фраз,
а вот что с фото делать, грузят массой и неудобно проверять :(
Фото только глазками проверять. Тоже когда то была такая задача, сделали страницу в админке с микропревъюхами фоток, что бы за раз можно было сотню фоток просмотреть на откровенную порнуху, например, и пачкой удалить лишнее. За несколько минут, так можно отмодерить тысячу фоток.
Может разрешить загрузку фото только с опр. фотохостингов? Возможно есть какие-то, где идет автомодерация порева. С другой стороны, если фото хостят боты, то можно решить блэклистом айпи-адресов и капчей.
А что за проект, если не секрет?
vkusnoserver, секрет всегда.
Спасибо за советы.
Фото только глазками проверять
Ну вот сейчас так и приходится делать, да глазки не резиновые :)
Я вот нашел софт, но после первых же тестов посмотрел - он ни фига не выбирает
http://www.mediadetective.com/
Запустил с настройками по умолчанию, он навыбирал и нормальные и несколько эротических из тестовой папки. Странно, а сайт у них вроде убедительный.
За пару дней перепробовал демо-версии нескольких программ из буржунета - ни одна (!) не выявляет точно эротические фото среди прочих.
Я не понимаю зачем они вообще тогда продают софт если он заведомо нерабочий.
Одним так и написал в суппорт.
Вопрос актуальный, надо из массы детектить порно, эро, полуобнаженные фото.
Наткнулся на след. обсуждение на stackoverflow.
Как я понял, основной метод распознавать - по тону кожи, т.е. на порно-картинках опр. области будет больше, нежели чем на обычных. Процент опознанной таким образом порнухи будет довольно большой (до 98%). Но, к сожалению, будет большим и процент ложных срабатываний на нормальных картинках (до 14%).
1. Вариант на питоне:
Сорс
2. nude.js на основе этого алгоритма.
3. Вариант внешней модерации, который я предлагал выше, через Amazon Mechanical Turk.
4. Еще алгоритмы на тему, если захотите вдруг кодить (все на английском): 1, 2.
Запустил с настройками по умолчанию, он навыбирал и нормальные и несколько эротических из тестовой папки. Странно, а сайт у них вроде убедительный.
Ещё не существует софта, который с 99%+ вероятностью отделит нежелательный контент от прочего. Данный софт может лишь помочь найти подозрительные картинки, но это не отменяет ручной проверки. Т.е. просто экономится время, т.к. надо проверять не тысячи фоток, а десяток-другой.
p.s. не использовал софт, ссылку на который вы кидали, и не могу оценить его качество.
Что значит не удобно проверять?
Сделайте админку удобную, чтобы быстро грузилась картинка, выделялись плохие слова и т.п.
Если что-то грузит плохое бан по IP на пару суток и т.п.
Это проблема будет временная, если поймут, что писать не имеет смысла то упадёт популярность говнопостинга.
Также создайте защиту на моменте регистрации. Я думаю пользователям же нужно региться? Пусть вводят капчту, потом вводят каптчу при каждом добавлении материала.
Возможно сделайте инвайтную систему допусков, тоже отличная идея.
Но всё зависит от баланса, не отпугнуть пользователей и постить нормальный контент.
Ещё не существует софта, который с 99%+ вероятностью отделит нежелательный контент от прочего
Ну это явно неправда, ведь в "безопасном поиске" по картинкам в Google как раз отсутствует порно, но присутствуют другие фото довольно точно совпадающие и по цвету кожи и проч.,
вопрос видимо в том секретная это технология или таки есть готовые решения.
vkusnoserver, смотрел темы, что-то там все недотягивает до результата. Тестировал готовые - практически все жуть.