1. 研究目的与意义
声音是人类感知周围环境的一种重要媒介,也是反映人类行为的重要特征。
此处所指的声音不仅指语音,还包括其他各种环境声音以及由人类活动产生的声音,如鸟鸣声,水流声,敲门声、爆炸声、脚步声等。
声音由于其包含了各种丰富的信息,一直备受研究学者的关注。
2. 课题关键问题和重难点
声纹数据的分类及前期特征提取。
声纹相关语料的收集;声纹相关语料的分类;声纹相关语料的标注;根据标注语料对声纹语料进行语音激活检测;对语料进行预加重、分帧及加窗处理;将每一帧数据进行相关特征提取;提取每一帧的能量作为特征参数;对数据进行特征选取;对相关特征进行组合。
基于模糊矢量量化模型的声纹检测。
3. 国内外研究现状(文献综述)
模糊矢量量化采用模糊 均值聚类算法来实现矢量量化,通过隶属度函数引入不确定性思想,实现对硬聚类算法的有效扩展,在同样码本尺寸的情况下,通过模糊 均值聚类分析可以减少码本的量化误差,在实际应用中取得过较好的效果[8]。
首先定义模糊 均值聚类算法目标函数为如下(2)式所示:(2)其中 为某一观察矢量序列; 为各聚类中心组成的码本; 为一个模糊 均值隶属度函数集, 是第 个聚类中心即第 个码字的隶属度函数,它满足 ; 代表模糊度;d 表示距离。
根据目标函数的模糊 均值聚类算式如下(3)式所示:模糊 均值算法具有较好的收敛性[12]。
4. 研究方案
本课题将会研究模糊矢量量化模型在声纹语音中的识别效果,并对这个模型进行分析,讨论其在声纹检测中的优缺点,并以此来写文章。
我将严肃进行数据采集筛选,特征筛选。
严谨选择模糊矢量量化参数选择,并积极对照结果进行比对。
5. 工作计划
第一周:查找文献资料,对基于模糊矢量量化(FVQ)模型算法的声音事件识别技术有个大体的了解;第二周:对课题中涉及的知识作深入掌握,掌握参数分析方法、基于模糊矢量量化(FVQ)模型算法的声音事件识别技术等;第三周:制定研究计划,写开题报告;第四周:学习程序语言以及编程方法;第五周:练习编程;第六周:实现参数分析方法软件部分;第七周:实现基于模糊矢量量化(FVQ)模型法的声音事件识别软件部分;第八周:实现基于模糊矢量量化(FVQ)模型算法的声音事件识别方法软件部分;第九周:实现系统软件联调的主要功能;第十周:实现软件的可视化界面;第十一周:程序修改和完善,结果分析;第十二周:写论文以及准备答辩;第十三周:写论文以及准备答辩;第十四周:验收程序,进行毕业设计答辩;
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。