1. 研究目的与意义
随着我国科技及经济的发展,人们的生活日益快捷简便。
但随着我国人口红利的消失,劳动人口及劳动成本的增加,需要更多的机器来替代本属于人的工作,机器在语种识别领域的作用亦不容忽视。
为了给人们提供更好的生活质量,为了推动经济的发展,本课题使用人工神经网络模型等方法来对语种进行检测,并将识别结果及时反馈给人们,这样可以保证人们可以一边进行翻译,一边进行其他工作,大大提高了时间利用率。
2. 课题关键问题和重难点
本课题主要是对语音进行检测,将检测结果报告出来。
具体工作内容安排如下:说话人语音数据的分类及前期特征提取。
说话人相关语料的收集;说话人相关语料的分类;说话人相关语料的标注;根据标注语料对说话人语料进行语音激活检测(voice activity detection ,VAD);对语料进行预加重、分帧及加窗处理;将每一帧数据进行相关特征提取;提取每一帧的能量作为特征参数;对数据进行特征选取;对相关特征进行组合。
3. 国内外研究现状(文献综述)
近几十年信息技术的发展,大规模集成电路及大型计算机的出现,给像声音事件检测等需要大量计算的算法带来了福音,使其研究及应用成为了可能。
并且,随着隐马尔科夫模型与高斯混合模型的理论成熟,其应用于语音信号处理成为了可能。
随着语音识别技术的实用化,隐马尔科夫模型和高斯混合模型得到不断改进与完善,因此,在语种识别领域使用HMM与GMM更是如虎添翼。
4. 研究方案
本课题将会研究深度神经网络在说话人语音中的识别效果,并对这个模型进行分析,讨论其在说话人语音检测中的优缺点,并以此来写文章。
我将严肃进行数据采集筛选,特征筛选。
严谨选择深度神经网络的模型参数选择,并积极对照结果进行比对。
5. 工作计划
(1)特征的筛选。
由于语音特征可以分为时域特征、频域特征、时频域特征及长时特征等,因此如何选择最有效的特征组合也是一大难题。
(2)高斯混合、隐马尔科夫及深度神经网络模型参数的选择。
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。