- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
VK приобрела 70% в структуре компании-разработчика red_mad_robot
Которая участвовала в создании RuStore
Оксана Мамчуева
Что делать, если ваша email-рассылка попала в спам
10 распространенных причин и решений
Екатерина Ткаченко
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Здравствуйте. У меня вопрос в первую очередь к тем, кто занимается созданием контента путем сканирования текста. Раньше я покупал контент, теперь нанял человека, который этим занимается. Хочется оптимизировать его работу.
Дело в том что после сканирования и разбора текста ADOBE Reader остается огромное количество переносов, ошибок и прочего мусора. Естественно руками выгребать все это очень долго. Отсюда вопросы:
1) Существует ли программа по чистке текста от переносов, работающая примерно следующим образом: анализ слова -> подбор предполагаемого слова.
2) Какие еще советы по оптимизации работы сканировальщика можете дать?
Здравствуйте. У меня вопрос в первую очередь к тем, кто занимается созданием контента путем сканирования текста. Раньше я покупал контент, теперь нанял человека, который этим занимается. Хочется оптимизировать его работу.
Дело в том что после сканирования и разбора текста ADOBE Reader остается огромное количество переносов, ошибок и прочего мусора. Естественно руками выгребать все это очень долго. Отсюда вопросы:
1) Существует ли программа по чистке текста от переносов, работающая примерно следующим образом: анализ слова -> подбор предполагаемого слова.
2) Какие еще советы по оптимизации работы сканировальщика можете дать?
А стандартные функции ворда не подходят? Поиск + замена для удаления переносов, Проверка орфографии-(заменить все) для текста
Проверка орфографии - пробовали, слова сильно покалеченные нераспознаются вордом, а так работает.
поиск + замена - приедтся использовать для каждого слова отдельно.
Ashina, ай-ай-ай, нехорошо. Скан запрещён на форуме.Возможно, здесь запрещена лишь его продажа(точно не припомню), но авторские права в любом случае нарушаются
..ADOBE Reader..
А чем FineReader не устраивает?
Не знал, спасибо что сказали. Но мы оцифровываем классику, который в интернете нет (кто - нибудь слышал про произведения Шакарима Кудайбердиева в интернете? :) )
А классика как известно вещь такая - тут точность нужна.
Его и имел в виду. Просто недописал )
Во что нашёл:☝
О сканировании
Сканирование по Закону считается репродуцированием, что запрещено даже в личных целях.
Распространение сканов в сети Интернет является уголовным преступлением.
Репродуцированные материалы немедленно уничтожаются, а лица, допустившие нарушение, наказываются в соответствии с Правилами SE.
Ссылка на первоисточник:
Не совсем согласен с тем, что это должно наказываться. Здесь главное знать цель, если коммерция то да, а если благотворительность то нет. А то под таким девизом и старые здания (архитектурные памятники) не должны реконструироваться.
если не брать в расчет незаконность сканирования (ведь скан может быть использован в личных целях), расскажу как делал в свое время я. Тоже промышлял когда то сканом.
В общем чтобы не сильно парится с вордом (хотя там все тоже достаточно легко) - тупо копировал текст в вордпад. Там эти ненавистные перевернутые Г видны. Заменой на пустой символ удаляешь эти боковые Г.
Потом кпипаст в ворд.
Все.