Win10 正式版 系统 下载 主题 平板

重定义Modern UI,打造完美Windows全新体验

Windows10下载|安装|新手宝典|必备软件

远景论坛 - 微软极客社区 › 论坛 › 精华版块讨论区 › 闲聊畅谈区 > 48kHz与44.1kHz的采样率在互相转换的时候真的存在人耳频 ...

返回列表发表新帖

查看: 4141|回复: 5

[纯净水] 48kHz与44.1kHz的采样率在互相转换的时候真的存在人耳频段的失真吗？ [复制链接]
电梯直达
复制

飘逸～┰⌒～

Rank: 9

UID: 2107182
帖子: 3041
PB币: 217
贡献: 0
技术: 243
活跃: 2772

楼主

发表于 2020-4-3 00:39:23 IP属地山东 |只看该作者 |倒序浏览

本帖最后由飘逸～┰⌒～于 2020-4-3 11:03 编辑

晚上闲着没事，突发奇想做了一下实验。
软件用的Au。
之前在B站有UP提到过：

“这个采样转换过程存在物理波形上存在形变”。

2020-4-2 23:13 上传
下载附件 (31.07 KB)
请勿使用多线程下载工具下载论坛附件！

我就懵了，难道我大学的信号与系统和通信原理基础白学了Σ(ﾟдﾟ;)

你说物理波形上存在形变，我想你肯定不是说幅度上的变化，那一定是它出现新的频率分量，而且采样率变换不会改变波形周期，那它的形变一定是由高频分量引起的：

周期不变，2kHz的正弦波的形变一定对应着新的高频分量

那它到底有没有发生这个形变呢？这个帖子正是要验证这个。

与这个转换过程有密切关系的一个原理，叫做奈奎斯特采样定理，定理内容如下：

频带为F的连续信号f(t)可用一系列离散的采样值f(t1),f(t1±Δt)，f(t1±2Δt)，...来表示,只要这些采样点的时间间隔Δt≤1/(2F)，便可根据各采样值完全恢复原来的信号f(t)。
对于时间上受限制的连续信号f(t)（即当│t│>T时,f(t)=0,这里T=T2-T1是信号的持续时间），若其频谱为F（ω）,则可在频域上用一系列离散的采样值来表示,只要这些采样点的频率间隔ω≦π / tm 。

应用在现在这个问题里，就是说，48kHz的采样率保存0～24kHz的声音信号可以被无损还原，44.1kHz的采样率保存0～22.05kHz的声音信号可以被无损还原。我为什么如此强调这个采样定理呢，就因为这里48kHz与44.1kHz的采样率都是绝对满足人耳听觉范围的采样率，理论上讲，一段音频经过这两种采样率的转换，都不会出现人耳听觉范围内的失真，说再具体点，是不会产生0～22.05kHz频段的失真。

但还是被反驳了：

“而这个48 441是数字间的转换是全频采样点位置的变化”

2020-4-2 23:26 上传
下载附件 (41.78 KB)
请勿使用多线程下载工具下载论坛附件！

哇你说这个我可就不困了啊，我当时回复了一些内容，大体也是描述了上面那个定理的实际意义，这里也放出来好了：

2020-4-2 23:28 上传
下载附件 (121.99 KB)
请勿使用多线程下载工具下载论坛附件！

这个UP主简介上写是一个职业音频工程师、混音师、母带师，而且看起来比我大很多，音频专业方面的知识看起来也比我了解很多，我感觉这个采样定理在这样一个职业音频工程师面前再怎么用文字解释都很苍白，那我们直接做个实验好了。

实验一：23kHz叠加20kHz正弦波和弦音的采样率变换

目的：验证采样率转换不会导致低采样率声音的失真。
预想结果：与采样定理描述的相同，采样率由48kHz向44.1kHz转换的时候，23kHz的频率分量会被直接削走，而20kHz的频率分量会毫无损伤的保留下来。采样率转为44.1kHz后，应该会看到音频文件里只剩一条漂亮的正弦波。
实验步骤：
1.生成一个48kHz采样率的单声道音频文件

2020-4-2 23:40 上传
下载附件 (195.72 KB)
请勿使用多线程下载工具下载论坛附件！

2.生成两个正弦波叠加的和弦音，参数如图

2020-4-2 23:41 上传
下载附件 (84.49 KB)
请勿使用多线程下载工具下载论坛附件！

3.缩放并观察生成的音频，可以看到波形是正弦波叠加的样子，频谱图中分别在23kHz和20kHz处存在平稳的频率分量。

2020-4-2 23:43 上传
下载附件 (151.5 KB)
请勿使用多线程下载工具下载论坛附件！

2020-4-2 23:43 上传
下载附件 (230.29 KB)
请勿使用多线程下载工具下载论坛附件！

4.采样率转换到44.1kHz

2020-4-2 23:44 上传
下载附件 (99.95 KB)
请勿使用多线程下载工具下载论坛附件！

2020-4-2 23:44 上传
下载附件 (42.96 KB)
请勿使用多线程下载工具下载论坛附件！

5.再观察音频的时域波形和频谱

2020-4-2 23:44 上传
下载附件 (151.96 KB)
请勿使用多线程下载工具下载论坛附件！

2020-4-2 23:44 上传
下载附件 (168.27 KB)
请勿使用多线程下载工具下载论坛附件！

看，多么漂亮的一条光秃秃的20kHz的正弦波
6.同样的，把这个20kHz换成22.04kHz，只要22.04kHz低于22.05kHz，它依然是不会失真的

2020-4-2 23:54 上传
下载附件 (87.86 KB)
请勿使用多线程下载工具下载论坛附件！

2020-4-2 23:54 上传
下载附件 (221.71 KB)
请勿使用多线程下载工具下载论坛附件！

2020-4-2 23:54 上传
下载附件 (53.68 KB)
请勿使用多线程下载工具下载论坛附件！

2020-4-2 23:54 上传
下载附件 (173.43 KB)
请勿使用多线程下载工具下载论坛附件！

现象&结论：
变换采样率的过程中，23kHz频率分量消失，而低于22.05kHz频率分量被很好地保留下来。
可以说采样率变低的时候，除了采样的时间点发生了变化，其更像是通过了一个低通滤波器。
即便是一个周期里几乎只打了两个采样点（如上图），这个正弦波依然是可以还原出来的。

而且保留下来的20kHz和22.04kHz波形都是干净的正弦波，周期和频率都没有变化，也没有产生任何新的频率分量，说明这两个留下来的正弦波没有发生任何形变。

实验二：0～24kHz频段的白噪音的采样率变换

目的：验证低采样率完全不保留高频信息。
实验步骤：

1.我们生成一段48kHz采样率下的白噪音，白噪音的频率分量的能量在该采样率支持的范围内是均匀分布的。

2020-4-2 23:56 上传
下载附件 (311.29 KB)
请勿使用多线程下载工具下载论坛附件！

2020-4-2 23:56 上传
下载附件 (390.93 KB)
请勿使用多线程下载工具下载论坛附件！

2.采样率变换到44.1kHz，并再次变换到48kHz，观察高频部分

2020-4-3 00:00 上传
下载附件 (422.04 KB)
请勿使用多线程下载工具下载论坛附件！

现象&结论：

高于22.05kHz的所有内容会丢失，但这个实验不能确定剩余部分是否发生了失真。

实验三：带限白噪声的采样率变换（利用实验二的特性，再次验证实验一的结论）

为了说明上面两个正弦波的确没有失真，我们把0～22.05kHz的部分理想化成直线，毕竟人眼分辨完美直线要比分辨完美正弦波要容易得多，万一你说我上面的正弦波存在肉眼看不到但是你们耳朵能听出来的失真呢对不对？
如果采样率变换会导致时域波形（也就是所谓“物理波形”）产生变化，那我用一个22.6kHz～24kHz的带通白噪声经过48kHz -> 44.1kHz的采样率变换，得到的新波形，通过实验二可以知道它一定不会有22.05kHz以上的频率分量存在，那么这个波形的形变肯定是落在0～22.05kHz区间的（虽然实验一已经证实了不可能），通过48kHz -> 44.1kHz的采样率变换后可以直接得到这个所谓的形变。
这个形变到底会不会产生呢？
实验步骤：

1.同样是生成这个0～24kHz白噪音

2020-4-3 00:10 上传
下载附件 (383.3 KB)
请勿使用多线程下载工具下载论坛附件！

2.经过带通滤波器，给它搞成带通白噪音

2020-4-3 00:20 上传
下载附件 (279.58 KB)
请勿使用多线程下载工具下载论坛附件！

3.采样率变换到44.1kHz

2020-4-3 00:22 上传
下载附件 (171.98 KB)
请勿使用多线程下载工具下载论坛附件！

没了！什么都没了！
现象&结论：
根本不会产生新的频率分量！0～22.05kHz里什么都没有出现！
即便采样点位再怎么变化，也不会导致低采样率范围内的信息变化，这个形变是采样点位发生变化带给你的错觉，实际上它除了会丢失高频信息，不会产生任何新东西。

结论

诸如48kHz到44.1kHz采样率变换这种操作，只要你用正经的转换工具，都只会是高于22.05kHz采样率的部分被削掉，低于22.05kHz的部分不会出现任何新的频率成分，0～22.05kHz的失真是不可能发生的。
不过对于44.1kHz采样率是否够用这个问题，如果你的音频在后期需要变调、变速处理的话（频谱搬移），肯定还是要在采样率上保留余量；如果不需要经过后期剪辑，比如你平时听的歌，44.1kHz采样率是绝对足够的（这里不讨论有损压缩格式对高频信息的残害）。
所以话说回来了，最初只是想证明“48kHz与44.1kHz的采样率在互相转换的时候不会存在人耳可闻的失真”，没想到做了这么多实验来验证。当然如果有人真的感觉自己能听出这种失真，还是劝这部分人去医院也好、申请世界纪录也好，把人耳听力范围的20kHz上限刷新一下，毕竟这个人耳20kHz的数据用了几十年了，说不定有些人种已经进化到了30kHz了呢？