lpcc_xiang 联合开发网

Pudn.com > 下载中心 > 语音合成 > lpcc_xiang

lpcc_xiang

所属分类：语音合成
开发工具：Visual C++
文件大小：2KB
下载次数：74
上传日期：2007-03-12 10:48:39
上传者：aa200

说明： c++语言开发，用于LPCC特征参数提取的，在语言识别系统中应用广泛。
(c language, LPCC Features for feature extraction, in language recognition system widely used.)

文件列表:

254412\lpcc_xiang\LPCC_c.txt (1376, 2007-03-12)
254412\lpcc_xiang (0, 2007-03-12)
254412 (0, 2011-02-18)

线性预测分析（LPC）从人的发声机理入手，通过对声道的短管级联模型的研究，认为系统的传递函数符合全极点数字滤波器的形式，从而某一时刻的信号可以用前若干时刻的信号的线性组合来估计。通过使实际语音的采样值和线性预测采样值之间达到均方误差 (MSE)最小，即可得到线性预测系数LPC. 实验证明LPCC特征参数与MFCC特征参数是较好的表征语音特征的参数。二者都是将语音从时域变换到倒谱域上，前者利用线性预侧编码(LPC)技术求倒谱系数，后者则直接通过离散傅立叶变换(DFT)进行变换。通常MFCC参数比LPCC参数更符合人耳的听觉特性。由于语音的信息大部分集中在低频部分，而高频部分易受环境干扰，MFCC参数将线性频标转化为MEL频标，强调语音的低频信息，从而突出了有利于识别的信息，屏蔽了噪声的干扰，而LPCC参数是基于线性频标的，所以在有信道噪声和频谱失真的情况下，MFCC参数能产生更高的识别精度。另外，MFCC参数无任何前提假设，在各种情况下均可使用，而LPCC参数假定所处理的信号为AR信号，对于动态特性较强的辅音，这个假设并不严格成立，而汉语数字语音识别需要对辅音有较强的分辨能力，所以MFCC参数在汉语数字语音识别中优于LPCC参数。由于LPC方法有效的解决了短时平稳信号的模型化问题，可把语音信号看成是由全极点产生的，很好的***近共振峰，提供谱估计，算法简洁准确，计算量小，便于实时处理。仅用12个LPG系数就能很好的表示复杂语音信号的特征，大大的降低了信号的冗余度，有效的减少了计算量和存储量，使之成为语音识别和压缩的基础。数字语音的端点检测出来后，即可对数字语音的每一帧进行声学参数分析，提取特征参数。整个系统的语音特征矢量计算10阶自协关系数，变换为10阶LPC系数，然后变换为12阶倒谱系数、12阶差分倒谱系数。

近期下载者：

相关文件：

评论：[我要评论] [举报此文件]

收藏者：