Другие журналы
|
Аппаратно - программный комплекс обработки и создания неформатных электронных документов на основе технологии автоадаптивных шрифтов
# 11, ноябрь 2014
DOI: 10.7463/1114.0734752
авторы: Андрианова Е. Г., Сотников А. Н., Чередниченко И. Н.
УДК 004.4
| Россия, МГТУ МИРЭА Межведомственный Суперкомпьютерный Центр РАН  |
Необходимость перевода в электронный вид документов на бумажных носителях потребовала разработки методов и алгоритмов для автоматических комплексов обработки и веб-публикаций неформатных графических документов он-лайн библиотек. Перевод отсканированных изображений в современные форматы электронных документов при помощи программ оптического распознавания текста сталкивается с серьезными трудностями. Эти трудности связаны со стандартизацией набора шрифтов и оформлением печатных документов. Также существует необходимость сохранения в электронном формате первоначального вида таких документов. В статье рассмотрена возможность построения расширяемого адаптивного словаря графических объектов, из которых состоят неформатные графические документы. Словарь автоматически корректируется по мере обработки графических объектов и накопления статистической информации для каждого нового документа. Этот адаптивный расширяемый словарь графических букв, шрифтов и других объектов автоматизированной обработки конкретного документа получил название «автоадаптивный шрифт», а совокупность методов его применения - «технология построения автоадаптивного шрифта». На основе теории алгоритмов вычисления оценок построена математическая модель, позволяющая представить все объекты неформатного графического документа единым образом, построить для каждого объекта вектор признаков и проводить оценку похожести этих объектов в выбранной метрике. Разработан алгоритм адаптивной коррекции образцов графических образов и предложен критерий для объединения похожих объектов в один элемент для построения автоадаптивного шрифта, что позволило построить программное ядро аппаратно-программного комплекса обработки неформатных графических документов. Разработана типовая блок-схема аппаратно-программного комплекса обработки неформатных графических документов. Приведено описание работы всех блоков этого комплекса, включая станцию обработки документов и ее взаимодействие с веб-сервером публикаций электронных документов. Список литературы- Gutenberg: website. Available at: http://www.gutenberg.org, accessed 01.10.2014.
- БиблиотекаКонгресса [The Library of Congress]: сайт. Режим доступа: http://memory.loc.gov/ammem/index.html (дата обращения 01.10.2014) .
- Сотников А.Н., Чередниченко И.Н. Построение автоадаптивного фонта в документах электронных библиотек // Программные продукты и системы. 2008. № 2. С. 16-20.
- Журавлев Ю.И. Об алгебраическом подходе к решению задач распознавания и классификации // Проблемы кибернетики. 1978. Вып. 33. С. 5-68.
- Сотников А.Н., Чередниченко И.Н. Построение словаря авто-адаптивного фонта // XVII Международная конференция по вычислительной механике и современным прикладным программным системам (ВМСППС'2011) (Алушта, Крым, 25-31 мая 2011 г.): матер. М.: Изд-во МАИ-ПРИНТ, 2011. С. 218-220.
- Березнев В.А., Волков А.Ю., Чередниченко И.Н. Об использовании преобразования Фурье в задаче распознавания рукописного текста // Вопросы моделирования и анализа в задачах принятия решений: сб. М.: ВЦ РАН, 2003. С. 153-159.
- Березнев В.А., Волков А.Ю., Чередниченко И.Н. О выборе параметров в алгоритме распознавания раздельного рукописного текста // Вопросы моделирования и анализа в задачах принятия решений: сб. М.: ВЦ РАН, 2004. С. 136-143.
- Чередниченко И.Н. Система публикаций документов в электронных библиотеках с использованием автоадаптивного шрифта // Приложение к журналу «Открытое образование». 2012. С. 186-189.
- Lorensen W.E., Cline H.E. Marching Cubes: A high resolution 3D surface construction algorithm // ACM SIGGRAPH Computer Graphics. 1987. Vol. 21, no. 4. P. 163-169. DOI: 10.1145/37402.37422
|
|