话音编码：探索声音的奥秘

网络整理 2023-10-01 10:06

3.1话音编码概要3.2脉冲编码调制(PCM)3.3PCM在通讯中的应用3.4增量调制与自适应增量调制3.5自适应差分脉冲编码调制3.6G.722SB-ADPCM编译码器3.7线性预测编码(LPC)的概念3.8GSM编译码器简介3.1话音编码概要3.2脉冲编码调制(PCM)3.3PCM在通讯中的应用3.4增量调制与自适应增量调制3.5自适应差分脉冲编码调制3.6G.722SB-ADPCM编译码器3.7线性预测编码(LPC)的概念3.8GSM编译码器简介3.13.1一、话音波形的特点声道可以觉得是一个混频器，压缩空气通过声门激励声道检波器，按照激励方法不同，发出的话音分成三种类型：韵尾(voicedsounds)：清音(unvoicedsounds)爆破音(plosivesounds)。一、话音波形的特点声道可以觉得是一个混频器，压缩空气通过声门激励声道混频器，按照激励方法不同，发出的话音分成三种类型：韵尾(voicedsounds)：清音(unvoicedsounds)爆破音(plosivesounds)。3.13.1韵尾：韵尾是一种称为准周期脉冲(quasi-periodicpulses)激励所发出的音，这些准周期脉冲是在声门打开之后关掉时中断脑部到声道的气流所形成的脉韵尾：韵尾是一种称为准周期脉冲(quasi-periodicpulses)激励所发出的音，这些准周期脉冲是在声门打开之后关掉时中断脑部到声道的气流所形成的脉3.13.1清音：清音是由不稳定气流激励所形成的，这些气流是在声门处在打开状态下强制空气在声道里高速收缩形成的。

清音：清音是由不稳定气流激励所形成的，这些气流是在声门处在打开状态下强制空气在声道里高速收缩形成的。3.13.1爆破音：爆破音是在声道关掉以后形成的压缩空气之后忽然打开声道所发出的音。爆破音：爆破音是在声道关掉以后形成的压缩空气之后忽然打开声道所发出的音。3.13.1二、三种话音编译码器话音编译码器分成以下三种类型：波形编译码器(waveformcodecs)：话音效量高，但数据率也很高音源编译码器(sourcecodecs)：数据率很低，形成的合成话音的音色差混和编译码器(hybridcodecs)：数据率和音效介于它们之间二、三种话音编译码器话音编译码器分成以下三种类型：波形编译码器(waveformcodecs)：话音效量高，但数据率也很高音源编译码器(sourcecodecs)：数据率很低，形成的合成话音的音色差混和编译码器(hybridcodecs)：数据率和音效介于它们之间3.13.1普通编译码器的音效与数据率普通编译码器的音效与数据率3.13.11、波形编译码器最简单的波形编码是脉冲编码调制(pulsecodemodulation，PCM)，它仅仅是对输入讯号进行取样和量化。

可采用非线性量化来增加数据率，如μ优点是编译码器简单，延后时间短，音效高缺点是数据速度比较高，对传输通道的错误比较敏感。1、波形编译码器最简单的波形编码是脉冲编码调制(pulsecodemodulation，PCM)，它仅仅是对输入讯号进行取样和量化。可采用非线性量化来增加数据率，如μ优点是编译码器简单，延后时间短，音效高缺点是数据速度比较高，对传输通道的错误比较敏感。3.13.1预测技术：从过去的样本来预测下一个样本的值差分脉冲编码调制(differentialpulsecodemodulation，DPCM)的基础—对预测的样本值与原始的样本值之差进行编码预测技术：从过去的样本来预测下一个样本的值差分脉冲编码调制(differentialpulsecodemodulation，DPCM)的基础—对预测的样本值与原始的样本值之差进行编码3.13.1DPCM对幅度随之变化的输入讯号会形成比较大的噪音，改进的方式之一就是使用自适应的预测器和量化器——自适应差分脉冲编码调制(adaptivedifferentialPCM，ADPCM)有16，24，32，40kb/s的ADPCM标准。其中32kb/s的ADPCM标准的音效十分接近64kb/s的PCM编译码器。

DPCM对幅度随之变化的输入讯号会形成比较大的噪音，改进的方式之一就是使用自适应的预测器和量化器——自适应差分脉冲编码调制(adaptivedifferentialPCM，ADPCM)有16，24，32，40kb/s的ADPCM标准。其中32kb/s的ADPCM标准的音效十分接近64kb/s的PCM编译码器。3.13.1频域法(timedomainapproach)：在频域里的编译码方式，如DPCM、ADPCM。卷积法(frequencydomainapproach):如子带编码和自适应变换编码。频域法(timedomainapproach)：在频域里的编译码方式，如DPCM、ADPCM。卷积法(frequencydomainapproach):如子带编码和自适应变换编码。3.13.1子带编码(sub-bandcoding，SBC)：输入的话音讯号被分成好几个频带(即子带)，变换到每位子带中的话音讯号都进行独立编码，比如使用ADPCM编码器编码，在接收端，每位子带中的讯号单独解码以后重新组合，之后形成构建话音讯号。因为对不同的子带单独编码，因而可以对不同的子带分配不同的量化位数。子带编码(sub-bandcoding，SBC)：输入的话音讯号被分成好几个频带(即子带)，变换到每位子带中的话音讯号都进行独立编码，比如使用ADPCM编码器编码，在接收端，每位子带中的讯号单独解码以后重新组合，之后形成构建话音讯号。

因为对不同的子带单独编码，因而可以对不同的子带分配不同的量化位数。3.13.1自适应变换编码(adaptivetransformcoding，ATC)：使用快速变换(比如离散正弦变换)把话音讯号分成许许多多的频带，拿来表示每位变换系数的位数取决于话音谱的性质。自适应变换编码(adaptivetransformcoding，ATC)：使用快速变换(比如离散正弦变换)把话音讯号分成许许多多的频带，拿来表示每位变换系数的位数取决于话音谱的性质。3.13.12、音源编译码器从话音波形讯号中提取生成话音的参数，使用这种参数通过话音生成模型构建出话音。针对话音的音源编译码器称作声码器(vocoder)。声道被等效成一个随时间变化的混频器，称作时变混频器。如LPC(线性预测编码)。2、音源编译码器从话音波形讯号中提取生成话音的参数，使用这种参数通过话音生成模型构建出话音。针对话音的音源编译码器称作声码器(vocoder)。声道被等效成一个随时间变化的混频器，称作时变混频器。如LPC(线性预测编码)。3.13.1混和编译码借助波形编码的高质量和音源编码的高压缩率。如频域合成-剖析(analysis-by-synthesis，AbS)编混频器：使用的声道线性预测混频器模型与线性预测编码(linearpredictivecoding，LPC)使用的模型相同，但不使用两个状态(有声/无声)的模型来寻找混频器的输入激励讯号，而使用其它的激励讯号。

混和编译码借助波形编码的高质量和音源编码的高压缩率。如频域合成-剖析(analysis-by-synthesis，AbS)编混频器：使用的声道线性预测混频器模型与线性预测编码(linearpredictivecoding，LPC)使用的模型相同，但不使用两个状态(有声/无声)的模型来寻找混频器的输入激励讯号，而使用其它的激励讯号。话音讯号分成许多帧(frames)，通常来说，每帧的长度为20ms。合成混频器的参数按帧估算，之后确定混频器的激励参数。得到激励参数和激励讯号进行存话音讯号分成许多帧(frames)，通常来说，每帧的宽度为20ms。合成混频器的参数按帧估算，之后确定混频器的激励参数。得到激励参数和激励讯号进行存3.13.1激励讯号馈献给合成混频器，合成混频器形成构建的话音讯号。激励讯号馈献给合成混频器，合成混频器形成构建的话音讯号。3.13.13.13.1多脉冲激励(multi-pulseexcited，MPE)编译码器等间隔脉冲激励(regular-pulseexcited，RPE)编混频器码激励线性预测(codeexcitedlinearpredictive，CELP)编译码器混和激励线性预测(mixedexcitationlinearprediction，MELP)等多脉冲激励(multi-pulseexcited，MPE)编译码器等间隔脉冲激励(regular-pulseexcited，RPE)编混频器码激励线性预测(codeexcitedlinearpredictive，CELP)编译码器混和激励线性预测(mixedexcitationlinearprediction，MELP)等3.13.1MPE，RPE和CELP编译码器之间的差异在于所使用的激励讯号的表示方式：MPE中，对每帧话音所用的激励讯号u(n)是固定数目的脉冲；RPE编译码器使用固定间隔的脉冲，但脉冲的数量则比MPE使用的数量多；CELP使用的激励讯号是量化矢量，激励讯号由一个矢量量化大码簿的表项给出MPE，RPE和CELP编译码器之间的差异在于所使用的激励讯号的表示方式：MPE中，对每帧话音所用的激励讯号u(n)是固定数目的脉冲；RPE编译码器使用固定间隔的脉冲，但脉冲的数量则比MPE使用的数量多；CELP使用的激励讯号是量化矢量，激励讯号由一个矢量量化大码簿的表项给出3.13.1编码器编码器MOS分MOS分64kb/s脉冲编码调制(PCM)64kb/s脉冲编码调制(PCM)4.34.332kb/s自适应差分脉冲编码调制(ADPCM)32kb/s自适应差分脉冲编码调制(ADPCM)4.14.116kb/s低信噪比码激励线性预测编码(LD-CELP)16kb/s低信噪比码激励线性预测编码(LD-CELP)4.04.0kb/s码激励线性预测编码(CELP)3.73.73.8kb/s码激励线性预测编码(CELP)3.8kb/s码激励线性预测编码(CELP)3.03.02.4kb/s线性预测编码(LPC)2.4kb/s线性预测编码(LPC)2.52.53.2(PCM)3.2(PCM)一、PCM的概念脉冲编码调制(pulsecodemodulation，PCM)的编码原理比较直观和简单，它的原理框图如右图所示：一、PCM的概念脉冲编码调制(pulsecodemodulation，PCM)的编码原理比较直观和简单，它的原理框图如右图所示：“防失真滤个低通混频器，拿来滤除声音频带以外的讯号“防失真滤个低通混频器，拿来滤除声音频带以外的讯号“波形编码器”可暂时理解为“采“波形编码器”可暂时理解为“采“量化器”可理解为“量化阶大小(step-size)”生成器或则称为“量化间隔”生成器“量化器”可理解为“量化阶大小(step-size)”生成器或则称为“量化间隔”生成器3.2(PCM)3.2(PCM)量化但可归纳成两类：一类称为均匀量化另一类称为非均匀量化采用的量化方式不同，量化后的数据量也就不同。因而，可以说量化也是一种压缩数据的方式。量化但可归纳成两类：一类称为均匀量化另一类称为非均匀量化采用的量化方式不同，量化后的数据量也就不同。因而，可以说量化也是一种压缩数据的方式。3.2(PCM)3.2(PCM)二、均匀量化

在语音子带编码方案中

上一篇：浏览器频繁崩溃？原因揭秘下一篇：没有了

话音编码：探索声音的奥秘

合作伙伴

商务合作

关于我们