IBM и представители Евросоюза объединят свои усилия по сканированию и составлению электронного каталога ценных исторических документов. Работа будет вестись в более чем 20 библиотеках, университетах, исследовательских лабораториях и компаниях-владельцах редких исторических документов и книг.
Проект, известный как Impact (Improving Access to Text), использует новые технологии сканирования для обеспечения наивысшего качества и точности копий, а также ускорения совместной работы над оцифровкой исторических документов. В дальнейшем Impact предоставит полученные копии для составления веб-каталога, по которому смогут искать пользователи. Таким образом, пользователи и исследователи, не имеющие прямого доступа к документу, смогут просмотреть его копию в сети Интернет.
Библиотеки и институты потратили около 20 лет на сканирование и распознавание документов собственными силами, однако плохое качество копий и устаревшие образцы написания букв значительно затрудняют процесс распознавания и замедляют работу.
Новое программное обеспечение, которое готова представить IBM, ускорит процесс распознавания и увеличит его точность на 25-50% по сравнению со стандартными программами распознавания. Кроме того, система может учитывать собственные ошибки и обладает способностью к самообучению, чтобы распознавать редкие шрифты. Для увеличения количества работающих над проектом, IBM привлечет добровольцев, готовых вычитывать документы, указывать на допущенные ошибки и выбирать из предложенных веб-интерфейсом вариантов наиболее подходящий.