- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
masyan, первым делом - что за библиотека? Второе - на какой должности вы там, если говорите о "безграничном доступе"?
Сталкивались ли Вы (или Ваши коллеги) с большим количеством работ по сканированию/распознаванию (от десятков тысяч страниц)? Осилите такой объём работ?
masyan, первым делом - что за библиотека? Второе - на какой должности вы там, если говорите о "безграничном доступе"?
Сталкивались ли Вы (или Ваши коллеги) с большим количеством работ по сканированию/распознаванию (от десятков тысяч страниц)? Осилите такой объём работ?
сис. админ.
с десятками тысяч страниц не сталкивались, но в 3 сканера не фиг делать заделаем при крупном заказе.
Обработать на 2-х процессорном серваке с 4 гигами оперативки. (для распознования)
В какой библиотеке я не буду говорить, это в моих интересах. А кому надо и так узнают.
Если на выходе Вордовский файл, то да
Обработать на 2-х процессорном серваке с 4 гигами оперативки. (для распознования)
Узкое место, в данном случае, это именно сканер и - особенно - последующая вычитка. Само распознавание не очень сложного по форматированию текста занимает... примерно 10 минут на 200 страниц в tiff-формате, с разрешением в 400 dpi. Сохранение в Ворде и того меньше.
У Вас есть люди, квалифицированно "приводящие в божеский вид" исходник? Поясню, к чему эти вопросы. Хотя вычитка и корректировка текста - занятие очень трудоемкое, специализированные компании начинают свой прайс с шести рублей за страницу, на эти работы (плюс ещё шесть - за само сканирование).
Вы сможете составить им конкуренцию? Иначе проще взять у Вас оригинал и отнести им в работу.
... Да, такой вопрос - есть ли в доступной Вам базе список издательств, книги которых представлены в библиотеке? Вы весьма обяжете форумчан, выложив его сюда.
оригинал не проще взять.... его не дадут вынести. Или пользуйтесь в пределах библиотеки или переписывайте, но это относится не ко всей литературе, само собой вы сможете взять "войну и мир", а вот с некоторыми журналами и старыми изданиями, которые уже не переиздаются все куда сложнее.
насчет предоставления в тифах - имхо не разумно, т.к. там куча штампов и прочей библиотековской ереси. оно мне не надо.
masyan, ну, хорошо.
Так у Вас есть список издательств? Это важно, поскольку не все ещё оптимизаторы берут абы какой контент, для разного рода недосайтов - некоторые привыкли работать "в белую" (начиная от договора с правообладателями, и заканчивая выпуском технически и организационно продуманных (и, зачастую, многофункциональных) ресурсов).
И такой вот список позволит быстро отсеять непригодные для оцифровки издания (в т.ч., и из-за невозможности заключить договор, о праве на онлайн-публикацию), сосредоточившись на действительно уникальных (и объёмных, замечу) книгах.
Второе - у Вас хватит сил на создание действительно "божеского" ворд-файла? Если не уверены, даю на пробу страничку (приаттачена к этому посту) - сколько времени у Вас уйдёт на оцифровку и корректуру 5-10 тысяч таких страниц (с учётом убирания переносов, раскрытия сокращений (и на иностранных языках тоже), сохранения выделения (жирным текстом и курсивом) и правки опечаток, конечно же)?
сколько времени у Вас уйдёт на оцифровку и корректуру 5-10 тысяч таких страниц?
Иш, демон, чего удумал-та!
P.S. Кстати "иш" пишется с мягким знаком или без?
DrJeans, с мягким.
Ну, а чего "удумал"? Мне легче записать десяток болванок, с хорошего качества оригиналом, чем перелопачивать текстовый исходник из оставленного на ночь файнридера, в который закачали всю книгу на пакетную переработку, автоматом.
И любому, думаю, будет легче.
Так что, факт наличия хорошего материала - ещё не освобождает от работы с ним. ;)