基于矢量量化模型的声音事件识别方法的研究开题报告

 2022-11-25 23:12:04

1. 研究目的与意义

伴随着近年来电子信息技术不断发展,声音事件识别技术也逐渐走进人们的生活。

一种通过对一种或多种语音信号的特征分析来达到对未知声音辨别的目的,其以独特的方便性、经济性和准确性等优势受到世人瞩目,它在现代许多领域内有良好的应用前景。

本文应用的是基于非参数模型的矢量量化VQ(VectorQuantization)方法。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 课题关键问题和重难点

由于由于人所发的语音是随着生理、心理和健康的状况变化的,不同时间下的语音会有所不同。

因此,如果说话人识别系统的训练时间与使用时间相差过长,会使系统的性能明显下降,并且目前机器仍然无法精确的确定采集目标。

若想要深入研究开发,则需要建立一个规模大的,采集声音例子足够多的声纹库,在后台通过大量信息比对筛选来确定采集目标。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 国内外研究现状(文献综述)

我们可以将每个待识别的说话人看作是一个信源,用一个码本来表征,码本是从该说话人的训练序列中提取的特征矢量聚类而生成,只要训练的数据量足够,就可以认为这个码本有效的包含了说话人的个人特征,而与说话的内容无关。

识别时,首先对待识别的语音段提取特征矢量序列,然后用系统已有的每个码本依次进行矢量量化,计算各自的平均量化失真。

选择平均量化失真最小的那个码本所对应的说话人作为系统识别的结果。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究方案

本课题将会研究矢量量化模型在声纹语音中的识别效果,并对这个模型进行分析,讨论其在声纹检测中的优缺点,并以此来写文章。

我将严肃进行数据采集筛选,特征筛选。

严谨选择矢量量化参数选择,并积极对照结果进行比对。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 工作计划

第一周:查找文献资料,对基于模糊矢量量化(FVQ)模型算法的声纹识别技术有个大体的了解;第二周:对课题中涉及的知识作深入掌握,掌握参数分析方法、基于模糊矢量量化(FVQ)模型算法的声纹识别技术等;第三周:制定研究计划,写开题报告;第四周:学习程序语言以及编程方法;第五周:练习编程;第六周:实现参数分析方法软件部分;第七周:实现基于模糊矢量量化(FVQ)模型法的声纹识别软件部分;第八周:实现基于模糊矢量量化(FVQ)模型算法的声纹识别方法软件部分;第九周:实现系统软件联调的主要功能;第十周:实现软件的可视化界面;第十一周:程序修改和完善,结果分析;第十二周:写论文以及准备答辩;第十三周:写论文以及准备答辩;第十四周:验收程序,进行毕业设计答辩;

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。