WEB

WEB
Рейтинг
514
Регистрация
25.01.2009

Visuall, друг, ну как ты? 😒

Я попал в топик для реализации подростковых комплексов и девиаций?

Stasmotion:
Строительный портал, но название домена никак не вяжется со стройкой

Почему не вяжется? «Стены». Их строят.

dndz-sat:
SR неплохое изобретение, но это отсечка сайтов-доноров по параметру трафика

Не доноров, а документов. SR рассчитывается для каждой страницы, поэтому на большинстве сайтов есть документы и с нулевым, и с отличным от нуля параметром.

vladand1:
Вообще чтобы отсеять потенциально неактивные сайты

Учитывая количество в системе оптимизаторов, там сайтов с n/a сейчас, наверное, больше половины.

Martin S:
Вот вы сейчас зря злите свидетелей секты Рогозина. Они сейчас просто зальют помоями ветку, посвященную прогрессу и дороге в будущее

…написал спустя семь часов тишины в топике свидетель секты маска. 🍿

sergv:
Не не, если текст мелкий - онли 600

Если пятым кеглем набрано? Да. Часто такие попадаются?

Стандарт для газеты — 8-9 пунктов, для книг — 10-12 пунктов. Сноски мельче — 6-7 пунктов — тоже отлично распознаётся при 300 dpi.

sergv:
тут в зависимости от шрифтов

Если ошибки связаны с особенностями гарнитуры, то большее разрешение поможет мало. Но для этих случаев в файнридере есть функция «Поиск и замена». При обнаружении закономерности прекрасно помогает обрабатывать огромные массивы текста. Я дореформенные книги и газеты распознавал и в полуавтоматическом режиме заменял все яти и т.д. на правильные символы.

Кроме того, файнридер можно «обучать» особенностям шрифтов, я эту функцию несколько раз использовал тоже.

Я уже 20 лет этим занимаюсь практически ежедневно по 3-10 часов, распознанный объём по объёму равен хорошей семейной библиотеке (около 1000 книг). Среди распознанного — несколько годичных подшивок газет начала XX века. Представляете, какое там качество и какой там алфавит? И даже для них 300 точек — за глаза.

---------- Добавлено 16.09.2018 в 08:53 ----------

Газеты, кстати, я вообще переснимал на камеру в режиме пересъёмки документов (повышенный контраст). Прекрасно распознаются с разрешением 72 dpi и общей плотности около 7 мегапикселей на формат ~А5.

sergv:
Текст я ниже 600 вообще никогда не сканирую, а в большинстве своем проще сразу 1200 выставить. Да, долго получается, зато потом не сидеть над ним пол дня, особенно, если он мелкий был. Но попробуйте 600 - может хватить

300 точек практически во всех случаях — за глаза. Если текст нормально читается, то с таким разрешением он и распознаётся нормально. А если читается плохо, то увеличение dpi не поможет.

---------- Добавлено 15.09.2018 в 22:17 ----------

cblcg:
старайтесь чтобы листы плотно к сканеру прилегали

Это верно, но если сканер хороший, то не критично.

ZiLok:
Метки креатив.

Да, говноделы меня любят, думают обо мне, ищут способы метку-другую добавить, чтоб увековечить. ;)

HERSH Russia, так вы свои лимиты-то у них отозвали? или так и продаёте?

Всего: 18546