音频质量PESQ得分评估原理与步骤

在实时音视频领域，我们经常需要评估音频质量。而语音质量评价是一个与语音学、语言学、信号处理、心理学、生理学等学科有密切联系的领域，因此语音质量评价是一个极其复杂的问题。语音质量评价方法从评价主体上可分为两大类：主观评价和客观评价。

主观评价：人评价（一般40人以上）。目前国内外使用较多的主观评价法有MOS法，韵母可懂度测量DRT，失真评价意见分DMOS，满意度测量DAM等。实际中，MOS法最常见，ITU.800标准定义了MOS评价方法。

客观评价：机器评价，原理上分为两类评价方式：基于输入输出方式的主动式评估和基于输出方式的被动式评估。客观评价主要依据的是原始语音信号和失真语音信号的时频域或变换域的特征参数差异对比，通常有2种评测方式。

基于ITU组织提供的 p.862 pesq客观评价方法对各应用进行音频评估。

基于pesq的下一代评测方法POLQA设备，专业音频质量测试设备、评估效果更具有普遍性、但是设备价格相对较贵。

pesq测试音频质量方法原理

由itu组织提出的pesq客观评价方法是将两个音频信号作为输入，其中一个由itu组织提供，另一个输入为经过被测voip系统处理后的输出信号。Pesq算法通过对输入的两个信号提取时频域或变换域特征参数的差异，再将特征参数差异经神经网络模型映射得到客观的音质分值。

测试步骤

（1）PC上播放参考音频信号Reference Voice（itu p862提供有16组标准中文录音样本，其中8组男声，8组女声）。

（2）播出来的声音传播至发送端被测VoIP App的输入端。

（3）声音经被测VoIP App处理后到达被测VoIP App的接收端，经被测VoIP App播放输出 ; PC端将 VoIP app的播放输出录制并保存下来即得到Degraded Voice。

（4）将Reference Voice与Degraded Voice作为pesq的输入，运行pesq即可得到每组测试的pesq音频客观评分值。最终取16组得分的均值作为此次pesq评分的结果。

接收端弱网环境模拟方法

弱网模拟有多种方法，本次模拟方法如下：在PC上配置wifi热点，移动手机连接wifi热点；再通过在pc上运行网络模拟软件来配置wifi热点的弱网情况。本次使用的模拟弱网软件为windows平台下的network-emulator-toolkit，通过其设置不同丢包率，模拟接收端的弱网环境。

码率的测试

为更好的对比不同app的通话质量，需要对其码率进行测试。测试过程中弱网环境模拟使用上小节所述方法，在PC上使用wireshark软件对接收端手机进行抓包，排除包中的ack包，最终用抓取到包中数据的总大小除以消耗的总时间，得到码率值。

在使用PESQ测试demo时，需要注意一些细节，否则可能导致测试得到的结果与预期相差较大，下面分条阐述。

4 thoughts on “音频质量PESQ得分评估原理与步骤”

庄慧慧说道：

2020年10月13日下午6:03

楼主可以提供下16组标准音频吗？我去itu上面看没有中文的，感谢感谢

回复
1. taxuefeihong说道：
  
  2020年10月17日下午10:56
  
  可以呀，我晚点把它发到网站上哈。
  
  回复
Robin_P说道：

2020年11月25日上午11:25

你好，能分享下中文的标准音频么？

回复
1. taxuefeihong说道：
  
  2020年12月8日下午10:42
  
  抱歉现在才回消息，我近期把标准测序音频贴到网站上哈。
  
  回复