基于波形编码技术的IP网络电话

2015-06-24 13:19:22郭东东马克
电脑知识与技术 2015年11期

郭东东++马克

摘要:为了有效利用IP网络电话中的信道资源,介绍了一种波形编码技术。利用K-L变换可以将语音信号中各分量间存在的相关性完全去除,达到语音信号最大限度的压缩。MATLAB仿真结果表明该方案的数据压缩率高以及自适应性强,解码具有良好的清晰度和自然度。

关键词:IP网络电话;波形编码;MATLAB

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2015)11-0201-02

IP Network Phone Based on Waveform Coding Technology

GUO Dong-dong, MA Ke

(College of Computer, Qinghai Normal University, Xining 810008, China)

Abstract: In order to effectively utilize the IP network telephone channel resources, introduces a waveform coding technique. K-L transform can be completely removed correlation between the components and realize maximum compression of the speech signal. MATLAB simulative results indicate that their data compression ratio is high and strongly adaptive, the decoding speech signal have good quality.

Key words: IP network telephone; waveform coding; MATLAB

1 概述

IP语音传输,或称为VoIP (Voiceover IP)是指将语音信号进行压缩编码和分包等处理,然后通过IP网络进行传输,最后在接收端重构语音的一种语音传输方式。IP网络电话中的语音处理主要解决两个问题:一是在IP网络环境下保证一定的通话质量,二是在保证一定语音质量的前提下尽可能地降低码率。基于线形预测编码技术及其LPC正则方程的自相关解法,在降低码率上取得一定的成效,但其抗噪能力较差[1,2];文献[3]和文献[4]对三种常用的IP电话语音压缩编码技术进行了阐述,三种技术分别得到了广泛应用。本文基于K-L变换波形编码技术的IP网络电话,它利用K-L变换最大程度地去除信号中的相关性则可达到数据压缩的目的,该算法不仅具有较低的传输码率,而且合成出的语音清晰、自然。

2 K-L变换及其编码原理

2.1 K-L变换基本原理

K-L变换是Karhunen-Love变换的简称,这是一种特殊的正交变换,主要用于一维和二维信号的数据压缩。

一个宽平稳的实随机向量[x=x0,x1,…,xN-1T],其协方差矩阵[Cx]定义为:

[Cx=Ex-μxx-μxT=c00c01…c0(N-1)c10c11…c1(N-1)????c(N-1)0c(N-1)1…c(N-1)(N-1)] (1)

式中[E?]代表求均值运算,[μx=Ex]是信号的[x]均值向量,[Cx]的元素

[Cxi,j=Exi-μxxj-μx=Cxj,i]

即协方差阵是对称的。显然,矩阵[Cx]体现了信号向量的各分量之间的相关性。若[x]的各分量互不相关,那么[Cx]中除对角线以外的元素皆为零。

K-L变换的思路是寻找正交矩阵[A],使得[A]对[x]的变换[y]的协方差阵[Cy]为对角矩阵,其步骤如下。

先由λ的N阶多项式

[λI-Cx=0]

求矩阵[Cx]的特征值[λ0],[λ1],…,[λN-1],再由式

[CAi=λiAi],i=0,1,…,N-1

求矩阵[Cx]的N个特征向量[A0],[A1],…,[AN-1],然后将[A0],[A1],…,[AN-1]归一化,即令[=1],i=0,1,…,N-1。由归一化的向量[A0],[A1],…,[AN-1]就可构成归一化的正交矩阵[A],即

[A=A0,A1,…,AN-1T]

最后由[y=Ax]实现对信[x]号的K-L变换。

重构信号就是解逆变换,由下式完成

[x=A-1y=ATy] (2)

对[x(n)]去除噪声,直接对x的变换y截取即可,即

[xΛ=i=0my(i)Ai] (3)

2.2 压缩编码算法原理

将语音信号分成长度为180点的语音帧x(n),去直流后按(1)式构造协方差矩阵Cx,作特征值分解,构造正交变换矩阵A;用A对x(n)作K-L变换得到变换后的信号y,将y按(3)式进行截取得到信号y;将y按(2)式进行K-L逆变换重构语音信号x;将重构语音x抽取为N点并对其编码传输到解码端;在解码段通过插值技术恢复为180点的语音帧,通过帧间拼接技术,合成出语音。

3 算法仿真实验

按照上面提出的方案,用Matlab进行仿真实验。在仿真实验中,利用计算机上的录音机功能录制语音样本,样本采用采样率为8kHz,8bit量化,PCM编码。

3.1 解码语音与原始语音波形比较

a 原始语音

b 解码语音

图1 解码语音与原始语音波形比较

图1是该样本的压缩4倍的解码语音波形和原始语音波形比较。从以上图中可以看出,压缩后的解码语音波形几乎与原始语音波形一致。由此可以说明,当样点数压缩4倍时解码语音具有良好的清晰度和自然度。

3.2 同一语音样本在不同信噪比下的仿真

在信噪比分别为18dB和10dB下,按本文算法4倍压缩编码后的解码语音波形比较。

a 原始语音

b 18dB带噪语音

c 10dB带噪语音

d 18dB下的解码语音

e 10dB下的解码语音

图2 不同信噪比下解码语音与原始语音波形比较

由图2可知,18dB噪声下的解码语音波形与原始语音波形非常逼近,表明,截取后的语音不仅信息损失很小,而且对随机的背景噪声具有很强的去噪能力。而10dB噪声下的解码语音稍有噪声的影响,这是由于处理过程中有效信息损失稍大,在解码段可选用恰当的插值函数予以改善。

4 结束语

基于波形编码技术的IP网络电话不仅具有较低的传输码率,而且合成出的语音清晰、自然。该技术不仅可用于IP网络电话,亦可用于数字语音存储。

参考文献:

[1] 苏菊宁,董鹏飞.语音压缩中的线性预测编码技术[J].现代电子技术,2000 (9):1-3.

[2] 王尚武.语音压缩中的线性预测编码技术[J].微机发展,2002(6):40-43.

[3] 徐春秀,武穆清.IP网络电话中常用的语音压缩编码技术的性能分析[J].电子技术应用,2001,27(10):6-9.

[4] 江兆祥.IP电话的语音压缩技术[J].电信工程技术与标准化,2003,(4):89-91.