Поиск "запрещенных" картинок на сайте

FU
На сайте с 04.10.2015
Offline
31
1633

Привет всем!

Поступила претензия Гугла к форуму по поводу наличия нежелательного контента - "обнаженка", а также "жестокость и насилие".

Причем в качестве примера такого нарушения была указана всего лишь одна ссылка.

На форуме, имеющем полмиллиона сообщений, практически невозможно просмотреть их все, чтобы привести в соответствие с "правилами добропорядочности". Картинки размещаются в качестве ссылок на сторонние ресурсы, так что физически на сервере ничего нет.

Попробовал просмотреть все ссылки на картинки в гугле и яндексе, но там ограничения - показываются только первых 500-1000 картинок.

Duck Duck Go указал, что в сообщениях на сайте содержатся 27.000 картинок, но показал тоже только первые 200-300 штук.

Понимаю, что можно проанализировать базу, вытащить все вхождения [ img ].....[ /img ], потом как-то вывести все эти картинки на страницу браузера и просмотреть. Но это с моими знаниями в программировании (а точнее - их отсутствием) - нереально.

Может кто-то знает, есть ли поисковики или сервисы, которые позволять обнаружить на форуме "деликатный" контент?

vandamme
На сайте с 30.11.2008
Offline
672
#1

ForU, поиск по картинкам на своем сайте site:site.ru просмотреть вручную, не миллион их же там.

R
На сайте с 31.08.2010
Offline
78
#2
Понимаю, что можно проанализировать базу, вытащить все вхождения [ img ].....[ /img ], потом как-то вывести все эти картинки на страницу браузера и просмотреть. Но это с моими знаниями в программировании (а точнее - их отсутствием) - нереально.

Это вам надо сделать запрос в базу по типу

SELECT column_text_message FROM table_comments WHERE column_text_message LIKE '

так вы получите все записи в которых содержится тег имг то бишь ваша картинка, потом регуляркой вытащить ссылки на эти картинки и ес-но все это нужно делать в цикле и отобразить.

А вообще вандамм вам дал совет вбейте в яндекс или гугл картинках поиск по картинкам своего сайта и просмотрите, правда не все из них могут быть проиндексированы

FU
На сайте с 04.10.2015
Offline
31
#3
Rokkkin:

А вообще вандамм вам дал совет вбейте в яндекс или гугл картинках поиск по картинкам своего сайта и просмотрите, правда не все из них могут быть проиндексированы

Я написал в стартпосте - DuckDuckGo определил количество таких ссылок - 27.000, но все поисковики отображают только 200-500-1000 вхождений.

swenter
На сайте с 04.08.2007
Offline
117
#4
ForU:
Понимаю, что можно проанализировать базу, вытащить все вхождения [ img ].....[ /img ], потом как-то вывести все эти картинки на страницу браузера и просмотреть. Но это с моими знаниями в программировании (а точнее - их отсутствием) - нереально.

Разместите объяву на фрилансе, программисты сделают за небольшую денежку выборку по базе и приведение потом всего этого в вэб-вид, если бесплатных вариантов больше нет.

T
На сайте с 13.08.2015
Offline
7
tum
#5

https://www.google.com/search?q=site:site.com&restrict=img_porn_moderate&safe=off&tbm=isch

Где site.com - Ваш сайт. Изменять в адресе.

Но это не панацея... Лучше в ручную все перебирать.

UrlEmbed.com (https://urlembed.com/) - превращаем ссылки на сайте в Embed карточки, извлечение контента, API. Тема на форуме. ()
vandamme
На сайте с 30.11.2008
Offline
672
#6
ForU:
ределил количество таких ссылок - 27.000, но все поисковики отображают только 200-500-1000 вхождений.

ну так там есть расширенный поиск по дате, возьмите разбейте на временные промежутки по году, к примеру.

FU
На сайте с 04.10.2015
Offline
31
#7
tum:
https://www.google.com/search?q=site:site.com&restrict=img_porn_moderate&safe=off&tbm=isch
Где site.com - Ваш сайт. Изменять в адресе.
Но это не панацея... Лучше в ручную все перебирать.

О, отлично, удалил в результате штук 100 картинок, найденных этим способом.

Спасибо!

А все опции поисковой строки Google где-то можно прочитать?

vandamme
На сайте с 30.11.2008
Offline
672
#8
ForU:
О, отлично, удалил в результате штук 100 картинок, найденных этим способом.
Спасибо!
ForU:
А все опции поисковой строки Google где-то можно прочитать?

блин, а я о чем говорил все свои два поста в этой теме?

FU
На сайте с 04.10.2015
Offline
31
#9
vandamme:
блин, а я о чем говорил все свои два поста в этой теме?

Просто все картинки пересмотреть сложно (их 27.000).

Но после того, как tum подсказал опции фильтрации только "запретных картинок" - все стало проще.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий