江苏省自然科学基金(BK20131196) 作品数:5 被引量:14 H指数:3 相关作者: 俞一彪 陈雪勤 赵鹤鸣 陈浩 周燕 更多>> 相关机构: 苏州大学 苏州市职业大学 北京交通大学 更多>> 发文基金: 江苏省自然科学基金 国家自然科学基金 国家级大学生创新创业训练计划 更多>> 相关领域: 电子电信 更多>>
倒谱参数稀疏分解下的汉语音谎言检测 被引量:4 2018年 为了提高汉语语音的谎言检测准确率,提出了一种对信号倒谱参数进行稀疏分解的方法。首先,采用小波包滤波器组对语音信号进行多频带划分,求得子频带对数能量并进行离散余弦变换以提取小波包频带倒谱系数,结合梅尔频率谱系数得到倒谱参数;其次,依据K-奇异值分解方法分别利用说谎和非说谎两种状态下的语音倒谱参数集训练得到过完备混合字典,在此字典上根据正交匹配追踪算法对参数集进行稀疏编码提取稀疏特征;最终进行多种分类模型下的识别实验·实验结果表明,稀疏分解方法相比传统参数降维方法具有更好的优化性能,本文推荐的稀疏谱特征最佳识别率达到78.34%,优于其他特征参数,显著提高了谎言检测识别准确率。 樊晓鹤 赵鹤鸣 陈雪勤 周燕关键词:稀疏分解 语音信号 低信噪比环境下语音检测的邻域极值差分信号功率谱分维算法 被引量:1 2013年 提出一种邻域极值差分信号功率谱的分形维值算法,并用于低信噪比环境下的语音活动检测.在时域信号邻域范围内作极值差分检索获得邻域极值差分信号,进一步根据差分信号功率谱估计的最小误差求解分维值.在安静环境下,对正常语音和耳语音的语音信号活动检测(speech activity detection,SAD)性能与盒维相似,明显好于谱熵算法.多种噪声环境下的SAD检测结果显示,所提算法的误检率远低于谱熵算法,在除白噪声以外各种条件下的误检率均低于盒维算法,且计算量约为盒维算法的5%.实验表明,该算法在SAD检测和效率两方面具有良好的综合性能. 陈雪勤 俞一彪 赵鹤鸣关键词:语音活动检测 低信噪比 分形维 功率谱 群延时谱参数在汉语数字语音识别中的应用 被引量:1 2017年 汉语数字语音之间的高混淆性直接影响了汉语数字语音识别的效果,传统的语音识别方法很难对易混淆的语音做出有效的区分。本文提出了一种多参数、多级识别策略,先采用MEL谱参数基于HMM进行初级数字语音识别,然后对易混淆的数字对采用一种新的群延时谱参数——RRCGD-CC(Reflected Roots Chirp Group Delay-Cepstral Coefficients)基于SVM进行二次分类。实验结果表明,通过多参数多级识别方法,数字"2"和"8"的识别率提高了8%,数字识别系统的整体识别率提高了2.3%。这一结果充分说明了本文提出的多参数多级识别方法有利于提高汉语数字语音识别系统的识别性能,同时也说明了RRCGD-CC在易混淆数字语音的识别上是有效的。 周峰 俞一彪关键词:群延时 高表现力情感语料库的设计 被引量:5 2014年 针对高表现力情感语音合成的需要,设计并建立了一个具有四种情感状态(正常、喜悦、忧伤、愤怒)的高表现力情感语料库。该数据库包含1000个词组、700条语句,共30分钟的语料。论文分析并讨论了设计和建立情感语料库的几个重要准则:语料的选择、制定标注规范、安静的录音环境、情感的情景准备以及情感语料库经主观辨听的后期筛选。为达到高表现力,论文着重强调了情境诱发的重要性,主观听觉评价表明,本数据库具有明显的情感特征。 陈浩 师雪姣 肖智议 陈雪勤 俞一彪关键词:情感分类 约束条件下的结构化高斯混合模型及非平行语料语音转换 被引量:3 2016年 提出一种约束条件下的结构化高斯混合模型及非平行语料语音转换方法.从源与目标说话人的原始非平行语料中提取出少量相同音节,在结构化高斯混合模型的训练过程中,利用这些相同音节包含的语义信息及声学特征对应关系对K均值聚类中心进行约束,并在(Expectation Maximum,EM)迭代过程中对语音帧属于模型分量的后验概率进行修正,得到基于约束的结构化高斯混合模型(Structured Gaussian Mixture Model with Constraint condition,CSGMM).再利用全局声学结构(Acoustic Universal Structure,AUS)原理对源和目标说话人的约束结构化高斯混合模型的高斯分布进行匹配对准,推导出短时谱转换函数.主观和客观评价实验结果表明,使用该方法得到的转换后语音在谱失真,目标倾向性和语音质量等方面均优于传统的结构化模型语音转换方法,转换语音的平均谱失真仅为0.52,说话人正确识别率达到95.25%,目标语音倾向性指标ABX平均为0.82,性能更加接近于基于平行语料的语音转换方法. 车滢霞 俞一彪关键词:语音转换