lpcc_xiang

所属分类:语音合成
开发工具:Visual C++
文件大小:2KB
下载次数:74
上传日期:2007-03-12 10:48:39
上 传 者aa200
说明:  c++语言开发,用于LPCC特征参数提取的,在语言识别系统中应用广泛。
(c language, LPCC Features for feature extraction, in language recognition system widely used.)

文件列表:
254412\lpcc_xiang\LPCC_c.txt (1376, 2007-03-12)
254412\lpcc_xiang (0, 2007-03-12)
254412 (0, 2011-02-18)

线性预测分析(LPC)从人的发声机理入手,通过对声道的短管级联模型的研究,认为系统的传递函数符合全极点数字滤波器的形式,从而某一时刻的信号可以用前若干时刻的信号的线性组合来估计。通过使实际语音的采样值和线性预测采样值之间达到均方误差 (MSE)最小,即可得到线性预测系数LPC. 实验证明LPCC特征参数与MFCC特征参数是较好的表征语音特征的参数。二者都是将语音从时域变换到倒谱域上,前者利用线性预侧编码(LPC)技术求倒谱系数,后者则直接通过离散傅立叶变换(DFT)进行变换。通常MFCC参数比LPCC参数更符合人耳的听觉特性。由于语音的信息大部分集中在低频部分,而高频部分易受环境干扰,MFCC参数将线性频标转化为MEL频标,强调语音的低频信息,从而突出了有利于识别的信息,屏蔽了噪声的干扰,而LPCC参数是基于线性频标的,所以在有信道噪声和频谱失真的情况下,MFCC参数能产生更高的识别精度。另外,MFCC参数无任何前提假设,在各种情况下均可使用,而LPCC参数假定所处理的信号为AR信号,对于动态特性较强的辅音,这个假设并不严格成立,而汉语数字语音识别需要对辅音有较强的分辨能力,所以MFCC参数在汉语数字语音识别中优于LPCC参数。 由于LPC方法有效的解决了短时平稳信号的模型化问题,可把语音信号看成是由全极点产生的,很好的***近共振峰,提供谱估计,算法简洁准确,计算量小,便于实时处理。仅用12个LPG系数就能很好的表示复杂语音信号的特征,大大的降低了信号的冗余度,有效的减少了计算量和存储量,使之成为语音识别 和压缩的基础。 数字语音的端点检测出来后,即可对数字语音的每一帧进行声学参数分析,提取特征参数。整个系统的语音特征矢量计算10阶自协关系数,变换为10阶LPC系数,然后变换为12阶倒谱系数、12阶差分倒谱系数。

近期下载者

相关文件


收藏者