内蒙古大学蒙古文信息处理重点实验室 » 奥云蒙古文OCR系统正式问世,为内大成立60周年献礼 内蒙古大学蒙古文信息处理重点实验室 » 奥云蒙古文OCR系统正式问世,为内大成立60周年献礼

奥云蒙古文OCR系统正式问世,为内大成立60周年献礼

       在内蒙古自治区成立70周年,内蒙古大学成立60周年之际,内蒙古大学计算机学院蒙古文信息处理重点实验室成功研发了新型蒙古文印刷体识别(OCR)系统(奥云蒙古文OCR系统)为自治区和学校献礼。该系统以大数据、国际上最先进的深度学习技术和云服务为设计框架,是国内首个支持多种蒙古文字体、且识别正确率和整体功能达到实用水平的系统。
       该系统目前支持蒙古文白体、黑体、标题体、新闻体和哈旺体出版的图书、报纸、网络图像和PDF文件的识别。系统识别正确率高,并对每个识别单词提供多个扩展候选,用户可以方便快捷的进行二次加工。除支持在线识别,系统还提供批量上传、离线识别、高级编辑等功能,识别结果可导出为双层蒙古文PDF书籍、文本文件和word文件。奥云蒙古文OCR系统对外服务网址为http://ocr.mglip.com。该系统提供了云服务接口,开发者可利用该接口将蒙古文印刷体识别嵌入到其它应用系统。该系统的应用可以加快各领域蒙古文文档的数字化速度,提高蒙古文文档的利用水平,对蒙古文信息化具有重要推动作用,必将促进少数民族科技教育文化事业的发展。
       参与该系统研发师生主要有:飞龙副教授、魏宏喜副教授、高光来教授,苏向东博士,张晖(博士生,导师为高光来教授),路敏(博士生,导师为高光来教授)、王洪彬(硕士生,导师为候宏旭教授)等。

img9-3

图1 系统界面
img9-1

图2 识别结果自动关联和候选项智能推荐界面
img9-2

图3 蒙古文印刷体识别系统软件著作权

2017年9月3日



Email:csfeilong@imu.edu.cnfeilong571@163.com

©2016 内蒙古大学计算机学院蒙古文信息处理技术重点实验室 版权所有

Email:csfeilong@imu.edu.cn

feilong571@163.com

©2016 内蒙古大学计算机学院蒙古文信息处理技术重点实验室 版权所有

蒙公网安备 15010502000079号