基于图像的火车票识别研究及实现开题报告

 2023-10-10 15:04:10

1. 研究目的与意义

近几年,随着计算机技术的迅猛发展和相关理论的不断完善,数字图像处理技术在诸多应用领域受到广泛重视并获得重大开拓性的成就。例如:航空航天、生物医疗、工业检测、机器视觉、军事制导、艺术文化等。在这些领域中光学字符识别(OCR)是图像在机器视觉中重要且广泛的应用之一。我国在OCR技术方面的研究工作起步较晚,到1986年汉字识别的研究进入一个实质性的阶段,不少研究单位相继推出了中文OCR产品。但是早期的OCR系统由于识别率等多方面的原因,未能达到实际要求,同时由于硬件设备成本高,运行速度慢,也远没有达到实用的程度。进入21世纪,LeNet5网络的出现开创了深度学习的新纪元,并且在OCR的应用中达到了商用的水平。但是直到2012年,AlexNet网络的出现才使得机器视觉相关技术进入爆发期,同时识别网络和物体检测框架的革新也间接地促进了OCR技术的发展。

虽然目前OCR应用广泛,但是许多细分领域缺少相应研究,例如多种文字票面的识别等。由于票据版面复杂多样,信息内容多等原因,市面上大多用相应独立类别产品来对其识别,如增值税发票识别、支票识别、承兑汇票识别、银行票据识别等。随着中国高铁建设进入全面收获期,高铁的经济性、时效性和保障性,使得越来越多的人选择高铁出行,这其中包括许多企业的出差人士。面对这些车票,企业会计人员需要将车票信息手工输入财务软件,生成相应类别的车票报销凭证。会计人员必须仔细检查是否有任何遗漏的信息,以及信息的内容是否正确。这些人工操作流程质量低,缺乏效率。由于目前火车票票面信息识别的研究较少,一个基于图像的火车票识别系统就值得去研究与实现。

由于火车票票面信息属于多种字体混合排版,印刷材质大多以低品质纸张为主。同时火车票票面文字笔画易粘连,易断裂,这导致文字识别复杂度高,难度大,因此传统的OCR并不适用。目前市面上大多数票据识别系统都摒弃了传统方法,选择以神经网络来搭建框架,例如合合信息TextIn、百度IOCR、读光OCR等。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究内容和预期目标

一、 主要研究内容

1. 基于图像处理技术实现火车票票面信息的识别与提取。搭建基于图像处理的预处理模块和文本检测模块,训练基于神经网络的文本识别模型。

2. 预处理模块消除光学图像对计算机处理的相关干扰。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与步骤

一、研究方法

该研究可分为三大模块:图像预处理模块、文本检测模块和文本识别模块。

1. 预处理模块利用Hough变换、Radon变换、灰度处理、二值化、边缘检测等。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1]弓耀辉.图像文字识别中的预处理技术研究综述[J].信息通信,2017(09):291-292.

[2]王鑫.文字图像二值化及降噪处理[J].天津科技,2010,37(06):71-73.

[3]冯志昕,杨景皓,李鑫龙,周翔,王震.自然光条件下文本识别系统的设计与实现[J].现代信息科技,2022,6(16):26-28.

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 计划与进度安排

1. 2024.01.01-02.28:查阅收集参考资料;外文文献翻译;火车票图像收集。

2. 2024.03.01-03.10:完成开题报告。

3. 2024.03.11-03.31:完成图像预处理模块和文本检测模块的具体实现。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。