1. 研究目的与意义
几个世纪以来,与机器进行语音交互一直是人类梦寐以求的。
尤其在全面进入老龄化的今天,互联网科技的快速发展,人们的生活质量有了进一步的提升,但由于老年人学习能力下降、电子设备操作繁琐等原因,对智能电子设备的语音交互需求愈加强烈。
在日常生活中,我们可以看到许多语音操控和语音交互的例子,如智能手机、电脑、智能音箱、智能手表以及家用扫地机器人的语音助手等等,使用语音控制代替手动操作极大便捷了人们的生活。
2. 课题关键问题和重难点
尽管语音识别的研究已有半个世纪了, 但现有的语音识别系统仍存在许多困难, 还远远达不到实用化的要求, 主要表现在:(1)鲁棒性:目前的语音识别系统对环境条件的依赖性强, 要求保持测试条件和训练条件一致, 否则系统性能会严重下降。
(2)噪声问题:现有的语音识别系统大多只能工作在安静的环境下, 一旦在噪声环境下工作, 讲话人产生情绪或心理上的变化, 导致发音失真、发音速度和音调改变, 即产生Lombard 效应或Loud 效应。
常用的抑制噪声的方法, 可以概括为四个方面:谱减法、环境规整技术、不修正语音信号而是修正识别器模型使之适合噪声、建立噪声模型。
3. 国内外研究现状(文献综述)
与机器进行语音交流,让机器明白人类所发出的指令,一直是人们长期以来梦寐以求的。
语音识别技术在20世纪60年代和70年代的几部大片中得到普及,其中最著名的是Stanley Kubrick广受好评的电影《2001:太空漫游》,自那以后,语音识别技术也一直是广大大众感兴趣的话题。
在这部电影中,一个名为HAL的智能计算机以自然的声音说话,能够识别和理解流利的讲话,并做出相应的反应。
4. 研究方案
本次设计的语音控制系统计划分为四个部分:直流电源单元、语音采集识别处理单元、指令信号处理单元以及水流控制单元。
计划采用STC89C52单片机以及Hilink语音识别模块实现对水流大小的控制目的。
直流电源单元:计划采用Hilink交流转直流降压稳压模块将220V电压分别降至12V(第三档流速电压)、9V(第二档流速电压)、5V(给STC89C51单片机供电的电源以及第一档流速电压)和3.3V(Hilink语音识别模块额定电压)以维持系统的正常用电。
5. 工作计划
第一阶段 完成文献综述、开题报告和外文翻译通过查阅相关资料,熟悉声音信号处理的相关流程,了解常用声音识别的方法,了解深度学习模型构建,算法实现等。
第二阶段 方案论证通过查阅相关资料,了解语音识别系统的基本组成构成和原理并给出本次设计的最初框架。
第三阶段 直流电源单元设计根据设计的初步框架和系统对电源的实际需要,选择相应参数的直流电源。
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。