搜索到207篇“ 美尔频率倒谱系数“的相关文章
- 一种声纹美尔频率倒谱系数干扰消除算法研究被引量:2
- 2013年
- 在伴随着外部噪声的情况下,待识别的声纹美尔频率倒谱系数特征各项属性很容易受到外部噪声的干扰发生改变,造成声纹特征的识别的精度不高。为提高精度,提出了一种用支持向量机的美尔频率倒谱系数特征干扰去除算法。确定分类决策函数时充分考虑美尔频率倒谱系数与声纹中心以及噪声之间的关系,并且将声纹特征引入核函数,将原空间样本数据通过非线性变换映射到高维特征空间,在高维空间中求最优或广义最优分类面,实现对语音特征的干扰消除。实验表明,利用改进算法实现了声纹特征中过零率,倒谱特征、矩形窗和汉明窗长的短时能量函数特征的优化。
- 蒋琳琼贺建飚
- 关键词:美尔频率倒谱系数支持向量机
- 安卓平台说话人识别系统的实现
- 2021年
- 本文在安卓平台上设计实现了基于GMM模型的说话人识别系统,完成了GMM模型参数的训练和识别过程。并基于TIMIT语料库,通过调整GMM阶数和测试人数,对基于GMM模型的说话人识别系统的时效性进行了验证分析。实验结果表明:(1) GMM模型的阶数越多,系统的识别时间越长;(2)测试人数越多,系统的识别时间越长。在GMM模型阶数不高以及使用人数不多的情况下,该说话人识别系统基本满足用户的使用需求。
- 何建军
- 关键词:美尔频率倒谱系数高斯混合模型说话人识别
- 基于GMM的说话人识别系统研究及其MATLAB实现被引量:4
- 2021年
- 为在嵌入式平台上实现说话人识别,分析研究说话人语音信号预处理、特征提取及GMM模型基本原理,并应用MATLAB实现基于GMM模型的说话人识别系统。基于TIMIT语料库,通过调整GMM阶数和语音时长,对系统性能进行验证分析。实验结果表明:①随着GMM模型阶数的增加,识别率随之提升,但计算量也急剧增加,当阶数达到16附近时,识别率则不再提升,反而出现了降低的趋势;②增加训练样本时长可从总体上提升识别率,但达到一定程度后便很难再继续提升。该结果对于在嵌入式平台上实现说话人识别具有较高参考价值。
- 何建军
- 关键词:说话人识别语音识别美尔频率倒谱系数高斯混合模型
- 说话人识别算法鲁棒性研究被引量:2
- 2017年
- 由于噪声干扰问题,说话人识别算法的效率受到很大影响.为此,在美尔倒谱系数特征提取的基础上,采用半升正弦函数对特征进行修正.采用特征规整、特征弯折和特征映射三种方法对特征进行校对.为提高说话人识别率以及模型的鲁棒性,提出混合BP神经网络与混合高斯模型的方法,将高斯混合模型的概率输出作为神经网络输入,从而获取说话人间的交互信息.试验结果显示,算法的识别率高,抗噪性好.
- 冯月芹郝雯超陈义王蕾李春光
- 关键词:说话人识别美尔频率倒谱系数高斯混合模型神经网络
- 重录语音检测算法被引量:5
- 2017年
- 非法认证者可通过播放重新录制合法认证者的语音欺骗说话人识别系统以获得进入系统的权限,为社会安全带来威胁。因此,重录语音的检测具有现实的紧迫性,但相关的研究报道仍较缺乏。为此,本文提出一种重录语音的检测算法。该算法以MFCC(Mel-Frequency Cepstral Coefficients,美尔频率倒谱系数)的统计量作为SVM(Support Vector Machine,支持向量机)和KNN(K-Nearest Neighbors,K最近邻)分类方法的特征;除以上两种分类方法外,本文亦考察使用SAE(Sparse Autoencoder,稀疏自动编码器)的检测性能。为模拟现实生活中重录语音的真实情景,本文实验通过不同的录音设备、录音距离及录音环境对算法进行全面的测试。实验结果表明,通过增加重录语音的多样性作为训练可以使该算法的正确率提高到99.67%,达到了较好的检测性能。
- 李山路王泳甘俊英
- 关键词:社会安全美尔频率倒谱系数支持向量机
- 脑电信号驱动的个性化情绪音乐播放系统算法研究及初步实现被引量:3
- 2016年
- 为了能实时监测听众的情绪状态变化并据此调整音乐播放列表,本文中,我们基于便携式干电极脑电数据提出了一种脑电驱动的个性化情绪音乐推荐系统的算法框架,并在Android平台上进行了初步开发实现。我们以效价和唤醒度二维情绪模型为基准,将脑电和相应种子歌曲映射到各个情绪坐标象限内,从而建立映射关系。然后应用美尔频率倒谱系数分析音乐库中各歌曲与种子歌曲之间的相似度并进行排序。最后,在播放歌曲阶段,我们通过脑电来识别听众的情绪状态,根据事先获得的情绪状态匹配关系播放并实时调整相应的歌曲曲目列表。
- 马勇李娟吕彬
- 关键词:脑电图情绪美尔频率倒谱系数
- 一种改进动态特征参数的话者语音识别系统被引量:4
- 2015年
- 研究语音动态特征参数提取问题,在话者语音识别过程中,动态特征参数可以有效提高识别率。但是传统算法在其提取过程中存在大量干扰冗余信息,造成了识别率降低并带来运算速度的降低。为解决上述副作用,提出在说话人识别系统中,使用一种动态时频倒谱系数参数的方法。上述方法在不减少反应话者个体特征分布特性的前提下,可消除冗余信息并降低样本特征的维度。利用上述方法提取语音特征参数并输入混合高斯-通用背景模型进行说话人语音分类。在Matlab上仿真结果表明,动态时频倒谱系数可有效改进话者语音识别系统的识别正确率。
- 申小虎万荣春张新野
- 关键词:美尔频率倒谱系数
- 脑电信号驱动的个性化情绪音乐播放系统算法研究及初步实现
- 为了能实时监测听众的情绪状态变化并据此调整音乐播放列表,本文中,基于便携式干电极脑电数据提出了一种脑电驱动的个性化情绪音乐推荐系统的算法框架,并在Android平台上进行了初步开发实现.以效价和唤醒度二维情绪模型为基准,...
- 吕彬李招华巫彤宁
- 关键词:脑电信号情绪美尔频率倒谱系数
- 基于MFCC和HMM的腭裂语音辅音省略识别算法被引量:6
- 2014年
- 为了弥补国内外在腭裂语音辅音发音错误识别方面的漏缺,以及为临床腭裂语音类型的诊断提供一种非主观的辅助措施,提出了一种基于语音识别系统的腭裂语音辅音省略识别算法。对腭裂语音辅音发音错误特点进行了语谱图上的能量研究,建立了改进参数的基于美尔频率倒谱系数和隐马尔科夫模型的腭裂语音识别系统。实验结果表明,该语音辅音省略识别算法取得了较高的正确率,实现了对腭裂语音清晰度的自动量化评估,可以用于临床辅助诊断。
- 袁亚南何凌龚晓峰尹恒李杨
- 关键词:腭裂语音美尔频率倒谱系数隐马尔科夫模型
- 徽州方言孤立字识别的实现被引量:2
- 2014年
- 徽州方言和普通话差异非常大,用声学研究的方法对徽州方言进行识别,先把休宁话数字语音采样后,将过零率作为参数进行端点检测,提取美尔频率倒谱系数(MFCC)声学特征后,把动态时间规整(DTW)作为识别的模型,对休宁话的孤立字进行识别,平均识别率较低。然后将短时能量也作为参数进行端点检测,把MFCC特征的一阶导数也作为识别参数,把DTW识别算法进一步改进,平均识别率有所提高。
- 石瑛王雪飞汪欣沈来信
- 关键词:美尔频率倒谱系数动态时间规整端点检测
相关作者
- 景新幸

- 作品数:169被引量:545H指数:11
- 供职机构:桂林电子科技大学
- 研究主题:语音识别 说话人识别 矢量量化 DSP 特征参数
- 陈鸿昶

- 作品数:126被引量:441H指数:11
- 供职机构:中国人民解放军信息工程大学
- 研究主题:网络 复杂网络 行人 链路预测 聚类
- 李邵梅

- 作品数:73被引量:249H指数:8
- 供职机构:解放军信息工程大学
- 研究主题:行人 目标跟踪 网络 卷积 卷积神经网络
- 胡洁微

- 作品数:24被引量:20H指数:3
- 供职机构:中国人民解放军防化指挥工程学院
- 研究主题:软件设计 单晶炉 单片机 电源 DSP
- 孔维功

- 作品数:27被引量:79H指数:4
- 供职机构:邢台职业技术学院
- 研究主题:空调 毛细管网 蓄电池 新风系统 控制系统