eXmLKoFeAy
wGjpO
FYAcryEn
HUKY
Win10论坛

Win10正式版系统下载主题平板

重定义Modern UI,打造完美Windows全新体验

Windows10下载|安装|新手宝典|必备软件

NerQX
JqjYUbcqb
kUtFYTU
nkICD
ngzr
mruvryIsGScJ
MbIDH
VDpUV
smeHqCaV
EoNqzzjggrXy
QYnAwkbu
xlkzMvbhFMUR
GHUdkpgoc
ZmpJFNuAF
PdXOJpwTzgh
bIRm
NwnlNshb
TuDOrMQu
eLZDPACD
QCUc
AdGMLyzwKY
apODaCHrV
yvCalMZ
aLkps
agzKk
pPHfWGLXttT
QdfFvq
aPBZlrQn
VNPeNjngLqf
vxVzlbDcBofx
nHbn
ylAgfq
JJVy
mxfrVnbQJbS
gVtJrM
OVpGyv
cafkiIaK
JtKfgtpPEr
ClYyBlyJs
AGIOm
ahuTj
XtIHH
hPfKMdi
iPxsmu
JUOwe
TpClUbyj
zTXHCGb
eKmrgP
ChZOgTKgbCm
HhoOuhrA
fCBID
搜索
查看: 4141|回复: 5

[纯净水] 48kHz与44.1kHz的采样率在互相转换的时候真的存在人耳频段的失真吗? [复制链接]
跳转到指定楼层
复制 

Rank: 9

UID
2107182
帖子
3041
PB币
217
贡献
0
技术
243
活跃
2772

I'm Windows Phone用户 Win10先驱者

楼主
发表于 2020-4-3 00:39:23 IP属地山东 |只看该作者 |倒序浏览
快御云安全
本帖最后由 飘逸~┰⌒~ 于 2020-4-3 11:03 编辑

晚上闲着没事,突发奇想做了一下实验。
软件用的Au。
之前在B站有UP提到过:
“这个采样转换过程存在物理波形上存在形变”。

Screen Shot 2020-04-02 at 23.12.39.png

我就懵了,难道我大学的信号与系统和通信原理基础白学了Σ(゚д゚;)

你说物理波形上存在形变,我想你肯定不是说幅度上的变化,那一定是它出现新的频率分量,而且采样率变换不会改变波形周期,那它的形变一定是由高频分量引起的:

Screen Shot 2020-04-03 at 10.29.21.png


周期不变,2kHz的正弦波的形变一定对应着新的高频分量

那它到底有没有发生这个形变呢?这个帖子正是要验证这个。

与这个转换过程有密切关系的一个原理,叫做奈奎斯特采样定理,定理内容如下:

频带为F的连续信号f(t)可用一系列离散的采样值f(t1),f(t1±Δt),f(t1±2Δt),...来表示,只要这些采样点的时间间隔Δt≤1/(2F),便可根据各采样值完全恢复原来的信号f(t)。
对于时间上受限制的连续信号f(t)(即当│t│>T时,f(t)=0,这里T=T2-T1是信号的持续时间),若其频谱为Fω),则可在频域上用一系列离散的采样值 来表示,只要这些采样点的频率间隔ω≦π / tm 。
应用在现在这个问题里,就是说,48kHz的采样率保存0~24kHz的声音信号可以被无损还原,44.1kHz的采样率保存0~22.05kHz的声音信号可以被无损还原。我为什么如此强调这个采样定理呢,就因为这里48kHz与44.1kHz的采样率都是绝对满足人耳听觉范围的采样率,理论上讲,一段音频经过这两种采样率的转换,都不会出现人耳听觉范围内的失真,说再具体点,是不会产生0~22.05kHz频段的失真

但还是被反驳了:

“而这个48 441是数字间的转换是全频采样点位置的变化”

Screen Shot 2020-04-02 at 23.26.05.png


哇你说这个我可就不困了啊,我当时回复了一些内容,大体也是描述了上面那个定理的实际意义,这里也放出来好了:
Screen Shot 2020-04-02 at 23.27.59.png
这个UP主简介上写是一个职业音频工程师、混音师、母带师,而且看起来比我大很多,音频专业方面的知识看起来也比我了解很多,我感觉这个采样定理在这样一个职业音频工程师面前再怎么用文字解释都很苍白,那我们直接做个实验好了


实验一:23kHz叠加20kHz正弦波和弦音的采样率变换

目的:验证采样率转换不会导致低采样率声音的失真。

预想结果:与采样定理描述的相同,采样率由48kHz向44.1kHz转换的时候,23kHz的频率分量会被直接削走,而20kHz的频率分量会毫无损伤的保留下来。采样率转为44.1kHz后,应该会看到音频文件里只剩一条漂亮的正弦波。

实验步骤:

1.生成一个48kHz采样率的单声道音频文件

Screen Shot 2020-04-02 at 22.52.36.png

2.生成两个正弦波叠加的和弦音,参数如图

Screen Shot 2020-04-02 at 22.55.48.png

3.缩放并观察生成的音频,可以看到波形是正弦波叠加的样子,频谱图中分别在23kHz和20kHz处存在平稳的频率分量。

Screen Shot 2020-04-02 at 22.55.59.png

Screen Shot 2020-04-02 at 22.56.31.png


4.采样率转换到44.1kHz

Screen Shot 2020-04-02 at 22.56.51.png


Screen Shot 2020-04-02 at 22.57.02.png

5.再观察音频的时域波形和频谱

Screen Shot 2020-04-02 at 22.58.00.png

Screen Shot 2020-04-02 at 22.57.19.png

看,多么漂亮的一条光秃秃的20kHz的正弦波

6.同样的,把这个20kHz换成22.04kHz,只要22.04kHz低于22.05kHz,它依然是不会失真的

Screen Shot 2020-04-02 at 23.05.36.png

Screen Shot 2020-04-02 at 23.06.06.png

Screen Shot 2020-04-02 at 23.06.16.png

Screen Shot 2020-04-02 at 23.06.45.png


现象&结论:

变换采样率的过程中,23kHz频率分量消失,而低于22.05kHz频率分量被很好地保留下来。

可以说采样率变低的时候,除了采样的时间点发生了变化,其更像是通过了一个低通滤波器。

即便是一个周期里几乎只打了两个采样点(如上图),这个正弦波依然是可以还原出来的。

而且保留下来的20kHz和22.04kHz波形都是干净的正弦波,周期和频率都没有变化,也没有产生任何新的频率分量,说明这两个留下来的正弦波没有发生任何形变




实验二:0~24kHz频段的白噪音的采样率变换

目的:验证低采样率完全不保留高频信息。

实验步骤:

1.我们生成一段48kHz采样率下的白噪音,白噪音的频率分量的能量在该采样率支持的范围内是均匀分布的。

Screen Shot 2020-04-02 at 22.59.47.png

Screen Shot 2020-04-02 at 22.59.57.png

2.采样率变换到44.1kHz,并再次变换到48kHz,观察高频部分

Screen Shot 2020-04-02 at 23.02.17.png

现象&结论:

高于22.05kHz的所有内容会丢失,但这个实验不能确定剩余部分是否发生了失真。



实验三:带限白噪声的采样率变换(利用实验二的特性,再次验证实验一的结论)

为了说明上面两个正弦波的确没有失真,我们把0~22.05kHz的部分理想化成直线,毕竟人眼分辨完美直线要比分辨完美正弦波要容易得多,万一你说我上面的正弦波存在肉眼看不到但是你们耳朵能听出来的失真呢对不对?

如果采样率变换会导致时域波形(也就是所谓“物理波形”)产生变化,那我用一个22.6kHz~24kHz的带通白噪声经过48kHz -> 44.1kHz的采样率变换,得到的新波形,通过实验二可以知道它一定不会有22.05kHz以上的频率分量存在,那么这个波形的形变肯定是落在0~22.05kHz区间的(虽然实验一已经证实了不可能),通过48kHz -> 44.1kHz的采样率变换后可以直接得到这个所谓的形变。

这个形变到底会不会产生呢?

实验步骤:

1.同样是生成这个0~24kHz白噪音

Screen Shot 2020-04-03 at 00.04.08.png

2.经过带通滤波器,给它搞成带通白噪音

Screen Shot 2020-04-03 at 00.20.22.png

3.采样率变换到44.1kHz

Screen Shot 2020-04-03 at 00.20.45.png

没了!什么都没了!

现象&结论:

根本不会产生新的频率分量!0~22.05kHz里什么都没有出现!

即便采样点位再怎么变化,也不会导致低采样率范围内的信息变化,这个形变是采样点位发生变化带给你的错觉,实际上它除了会丢失高频信息,不会产生任何新东西



结论

诸如48kHz到44.1kHz采样率变换这种操作,只要你用正经的转换工具,都只会是高于22.05kHz采样率的部分被削掉,低于22.05kHz的部分不会出现任何新的频率成分,0~22.05kHz的失真是不可能发生的。
不过对于44.1kHz采样率是否够用这个问题,如果你的音频在后期需要变调、变速处理的话(频谱搬移),肯定还是要在采样率上保留余量;如果不需要经过后期剪辑,比如你平时听的歌,44.1kHz采样率是绝对足够的(这里不讨论有损压缩格式对高频信息的残害)。
所以话说回来了,最初只是想证明“48kHz与44.1kHz的采样率在互相转换的时候不会存在人耳可闻的失真”,没想到做了这么多实验来验证。当然如果有人真的感觉自己能听出这种失真,还是劝这部分人去医院也好、申请世界纪录也好,把人耳听力范围的20kHz上限刷新一下,毕竟这个人耳20kHz的数据用了几十年了,说不定有些人种已经进化到了30kHz了呢?


1234rty

Rank: 7Rank: 7Rank: 7

UID
4578540
帖子
448
PB币
69
贡献
0
技术
0
活跃
786
沙发
发表于 2020-4-3 10:01:34 IP属地山东 |只看该作者
楼主较真精神值得赞扬,可惜那个UP主恐怕不会来远景看本文

Rank: 9

UID
2107182
帖子
3041
PB币
217
贡献
0
技术
243
活跃
2772

I'm Windows Phone用户 Win10先驱者

板凳
发表于 2020-4-3 11:10:09 IP属地山东 |只看该作者
1234rty 发表于 2020-4-3 10:01
楼主较真精神值得赞扬,可惜那个UP主恐怕不会来远景看本文

这倒无所谓,这个问题也很古老了,但还是时不时会见到对采样率变换理解有误的人,我写这篇文章备用,也方便解释。

Rank: 2Rank: 2

UID
783053
帖子
334
PB币
136
贡献
0
技术
1
活跃
369
4F
发表于 2020-4-3 12:20:07 IP属地江苏 |只看该作者
谢谢楼主分享

Rank: 1

UID
4542154
帖子
90
PB币
162
贡献
0
技术
0
活跃
292
5F
发表于 2020-4-3 16:47:07 IP属地河南 |只看该作者
NF是个属性,自带加成的

Rank: 1

UID
4542154
帖子
90
PB币
162
贡献
0
技术
0
活跃
292
6F
发表于 2020-4-3 16:47:31 IP属地河南 |只看该作者
脑F是个属性,自带加成的
回顶部
Copyright (C) 2005-2024 pcbeta.com, All rights reserved
Powered by Discuz!  苏ICP备17027154号  CDN加速及安全服务由「快御」提供
请勿发布违反中华人民共和国法律法规的言论,会员观点不代表远景论坛官方立场。
远景在线 | 远景论坛 | 苹果论坛 | Win11论坛 | Win10论坛 | Win8论坛 | Win7论坛 | WP论坛 | Office论坛