1. 研究目的与意义
近几年,随着计算机技术的迅猛发展和相关理论的不断完善,数字图像处理技术在诸多应用领域受到广泛重视并获得重大开拓性的成就。例如:航空航天、生物医疗、工业检测、机器视觉、军事制导、艺术文化等。在这些领域中光学字符识别(OCR)是图像在机器视觉中重要且广泛的应用之一。我国在OCR技术方面的研究工作起步较晚,到1986年汉字识别的研究进入一个实质性的阶段,不少研究单位相继推出了中文OCR产品。但是早期的OCR系统由于识别率等多方面的原因,未能达到实际要求,同时由于硬件设备成本高,运行速度慢,也远没有达到实用的程度。进入21世纪,LeNet5网络的出现开创了深度学习的新纪元,并且在OCR的应用中达到了商用的水平。但是直到2012年,AlexNet网络的出现才使得机器视觉相关技术进入爆发期,同时识别网络和物体检测框架的革新也间接地促进了OCR技术的发展。 虽然目前OCR应用广泛,但是许多细分领域缺少相应研究,例如多种文字票面的识别等。由于票据版面复杂多样,信息内容多等原因,市面上大多用相应独立类别产品来对其识别,如增值税发票识别、支票识别、承兑汇票识别、银行票据识别等。随着中国高铁建设进入全面收获期,高铁的经济性、时效性和保障性,使得越来越多的人选择高铁出行,这其中包括许多企业的出差人士。面对这些车票,企业会计人员需要将车票信息手工输入财务软件,生成相应类别的车票报销凭证。会计人员必须仔细检查是否有任何遗漏的信息,以及信息的内容是否正确。这些人工操作流程质量低,缺乏效率。由于目前火车票票面信息识别的研究较少,一个基于图像的火车票识别系统就值得去研究与实现。 由于火车票票面信息属于多种字体混合排版,印刷材质大多以低品质纸张为主。同时火车票票面文字笔画易粘连,易断裂,这导致文字识别复杂度高,难度大,因此传统的OCR并不适用。目前市面上大多数票据识别系统都摒弃了传统方法,选择以神经网络来搭建框架,例如合合信息TextIn、百度IOCR、读光OCR等。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 研究内容和预期目标一、 主要研究内容 1. 基于图像处理技术实现火车票票面信息的识别与提取。搭建基于图像处理的预处理模块和文本检测模块,训练基于神经网络的文本识别模型。 2. 预处理模块消除光学图像对计算机处理的相关干扰。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
3. 研究的方法与步骤
|