人工客服:2025-06-09 17:07:51

世纪中文出版社 ——“建设顶级中文期刊”为使命!期待与您同行......
请输入您想了解的内容!
截图后在输入框直接粘贴

请您为我的服务评分:

发送提交
一种基于卷积神经网络的快速说话人识别方法
DOI,PDF 下载: 21  浏览: 258 
作者蔡倩高勇
作者单位四川大学电子信息学院
摘要:
提出了一种基于Gammatone滤波器倒谱系数(Gammatone Frequency Cepstral-Coefficients,GFCC)动态组合参数的卷积神经网络(Convolutional Neural Networks,CNN)结构来实现快速说话人识别的方法。提取语音样本的GFCC及其一阶差分和二阶差分系数作为代表语音的特征参数,对特征参数进行归一化处理,将得到的统计特征构造成CNN的输入形式。实验结果表明,与通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)相比,提出的模型方法学习速度更快,在提高识别率的同时减少了训练时间和识别时间。

版权所有 © 2025 世纪中文出版社  京ICP备2024086036号-2