уник. скан

12
юни
На сайте с 01.11.2005
Offline
933
#11

masyan, первым делом - что за библиотека? Второе - на какой должности вы там, если говорите о "безграничном доступе"?

Сталкивались ли Вы (или Ваши коллеги) с большим количеством работ по сканированию/распознаванию (от десятков тысяч страниц)? Осилите такой объём работ?

https://searchengines.guru/ru/forum/944108 - прокси-сервис на базе операторов домашнего интернета, сотни тысяч IP-адресов, канал от 20 Мбит
M
На сайте с 23.08.2007
Offline
5
#12
юни:
masyan, первым делом - что за библиотека? Второе - на какой должности вы там, если говорите о "безграничном доступе"?

Сталкивались ли Вы (или Ваши коллеги) с большим количеством работ по сканированию/распознаванию (от десятков тысяч страниц)? Осилите такой объём работ?

сис. админ.

с десятками тысяч страниц не сталкивались, но в 3 сканера не фиг делать заделаем при крупном заказе.

Обработать на 2-х процессорном серваке с 4 гигами оперативки. (для распознования)

В какой библиотеке я не буду говорить, это в моих интересах. А кому надо и так узнают.

масян.ру (http://masyan.ru)
mihan
На сайте с 20.12.2005
Offline
379
#13

Если на выходе Вордовский файл, то да

yeezypay.io - платежный сервис google.yeezypay.io - агентские кабинеты google ads
юни
На сайте с 01.11.2005
Offline
933
#14
masyan:
Обработать на 2-х процессорном серваке с 4 гигами оперативки. (для распознования)

Узкое место, в данном случае, это именно сканер и - особенно - последующая вычитка. Само распознавание не очень сложного по форматированию текста занимает... примерно 10 минут на 200 страниц в tiff-формате, с разрешением в 400 dpi. Сохранение в Ворде и того меньше.

У Вас есть люди, квалифицированно "приводящие в божеский вид" исходник? Поясню, к чему эти вопросы. Хотя вычитка и корректировка текста - занятие очень трудоемкое, специализированные компании начинают свой прайс с шести рублей за страницу, на эти работы (плюс ещё шесть - за само сканирование).

Вы сможете составить им конкуренцию? Иначе проще взять у Вас оригинал и отнести им в работу.

... Да, такой вопрос - есть ли в доступной Вам базе список издательств, книги которых представлены в библиотеке? Вы весьма обяжете форумчан, выложив его сюда.

M
На сайте с 23.08.2007
Offline
5
#15

оригинал не проще взять.... его не дадут вынести. Или пользуйтесь в пределах библиотеки или переписывайте, но это относится не ко всей литературе, само собой вы сможете взять "войну и мир", а вот с некоторыми журналами и старыми изданиями, которые уже не переиздаются все куда сложнее.

насчет предоставления в тифах - имхо не разумно, т.к. там куча штампов и прочей библиотековской ереси. оно мне не надо.

юни
На сайте с 01.11.2005
Offline
933
#16

masyan, ну, хорошо.

Так у Вас есть список издательств? Это важно, поскольку не все ещё оптимизаторы берут абы какой контент, для разного рода недосайтов - некоторые привыкли работать "в белую" (начиная от договора с правообладателями, и заканчивая выпуском технически и организационно продуманных (и, зачастую, многофункциональных) ресурсов).

И такой вот список позволит быстро отсеять непригодные для оцифровки издания (в т.ч., и из-за невозможности заключить договор, о праве на онлайн-публикацию), сосредоточившись на действительно уникальных (и объёмных, замечу) книгах.

Второе - у Вас хватит сил на создание действительно "божеского" ворд-файла? Если не уверены, даю на пробу страничку (приаттачена к этому посту) - сколько времени у Вас уйдёт на оцифровку и корректуру 5-10 тысяч таких страниц (с учётом убирания переносов, раскрытия сокращений (и на иностранных языках тоже), сохранения выделения (жирным текстом и курсивом) и правки опечаток, конечно же)?

zip 1.zip
DrJeans
На сайте с 06.07.2006
Offline
231
#17
юни:
сколько времени у Вас уйдёт на оцифровку и корректуру 5-10 тысяч таких страниц?

Иш, демон, чего удумал-та!

P.S. Кстати "иш" пишется с мягким знаком или без?

Спроси на Boosty: https://boosty.to/smorovoz SEO на Ютубе: https://www.youtube.com/@youtube-seo/
юни
На сайте с 01.11.2005
Offline
933
#18

DrJeans, с мягким.

Ну, а чего "удумал"? Мне легче записать десяток болванок, с хорошего качества оригиналом, чем перелопачивать текстовый исходник из оставленного на ночь файнридера, в который закачали всю книгу на пакетную переработку, автоматом.

И любому, думаю, будет легче.

Так что, факт наличия хорошего материала - ещё не освобождает от работы с ним. ;)

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий