Текст -> png;base64 -> текст ? PHP

D
На сайте с 28.06.2008
Offline
977
331

С горем пополам научился защищать нужную мне информацию переводя ее в png;base64

Это скажем так база значений (цифр) которые я собираю вручную и вывожу в таблицу.

Вот я научился и теперь вывожу в таблицу не цифры, а картинки в виде data:image/png;base64

Теперь мне интересно насколько сложен обратный процесс?

Попробовал погуглить и пока, насколько я понимаю это сделать реально, но сложно - нужно использовать библиотеки распознавания изображений.

Т.е. это сложно и геморройно или есть способ быстро вытащить мои цифры из data:image/png;base64 ?

IL
На сайте с 20.04.2007
Offline
412
#1
Dram:
это сложно и геморройно
Dram:
есть способ быстро вытащить мои цифры
Dram:
нужно использовать библиотеки распознавания изображений.

Всё именно так.. =)

Можно "скормить" картинки любому OCR сервису или программе типа FIneReader-а и посмотреть на результат.

Magazinshik
На сайте с 15.06.2016
Offline
56
#2
Dram:
Т.е. это сложно и геморройно или есть способ быстро вытащить мои цифры из data:image/png;base64 ?

Изображение в base64 элементарно парсится и сохраняется на том же php есть функция base64decode, дальше просто сохраняется изображение в файл. Для человека, который хочет забрать эти данные это всего одна дополнительная строчка кода.

Что касается цифр, то даже никакой OCR не нужен, можно разобрать их через бинарную матрицу, благо цифр всего 10.

Вот неплохая статья на эту тему: http://lifeexample.ru/php-primeryi-skriptov/raspoznavanie-kapchi-php.html

Реализуется такая ерунда довольно быстро, поэтому защититься не получится.

Домены/сайты в Google News (/ru/forum/1001331) - мгновенная индексация и трафик
D
На сайте с 28.06.2008
Offline
977
#3

Magazinshik, спасибо, оч интересная ссылка! Значит единственный вариант - добавлять случайные шумы того же цвета что и цифры?

Magazinshik
На сайте с 15.06.2016
Offline
56
#4
Dram:
Magazinshik, спасибо, оч интересная ссылка! Значит единственный вариант - добавлять случайные шумы того же цвета что и цифры?

Шумы или разные шрифты могут помочь в случае если захотят распознать через бинарные матрицы, тогда сумма пикселей не будет биться. Но в таком случае можно попробовать использовать OCR, это несколько сложнее уже, но всё равно задача решаемая.

Если уровень шумов такой, что даже OCR не справляется, то я бы попробовал просто напросто отправлять полученные изображения в антигейт на распознавание руками (как капчу), потому что если вы их руками собираете и вносите, значит их не так уж и много, а цена в 1$ за 1000 распознаваний вполне приемлема.

Т.е. в конечном счёте если стоит задача забрать эти данные, то вы не сможете их защитить, чтобы не делали. Вы можете отсеять какой-то процент дилетантов, которые не смогут написать распознавание по бинарной матрице или подключить OCR библиотеку, но те кто собирает данные профессионально их всё равно заберут.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий