50 毫秒有多长?
我在某个论坛的帖子里看到有人问显示器几十毫秒的延迟是怎么看出来的,正好我之前算过一些音频延迟相关的数据,可以提供另一个看待这个问题的角度。
首先说帖子里问题的结论:延迟不是看出来,而是感觉出来的。几十毫秒的延迟音乐人可以立马感觉到,属于完全不可接受的程度。录音一般至少需要的延迟是 10 ms 左右及以下,而到了这个区间,5 ms 的差别都非常大:10 ms 对比 5 ms 弹乐器完全是两种手感。
但如果光这么说,一般人对此可能还是没有太大概念,因此我们来换算一些数据看看。
50 ms 有多长?
距离
常温常压下的音速大约是 340 m/s。如果一个声音需要花 50 ms(0.05 s)到达你的耳朵,我们可以算出声源的距离为:
340 m/s * 0.05 s = 17 m
你可以想象自己在弹一把离你有 17 m 远的吉他。
速度
120 BPM 是音乐里比较中等的一个速度。如果我们弹十六分音符,也就是每拍 4 个音的话:
120 beats/minute * 4 notes/beat = 480 notes/minute = 8 notes/s
那么,一个音的长度就是 1000 ms / 8 = 125 ms。
50 ms 的延迟意味着你弹的每个音都会跑拍 50 ms / 125 ms = 40%。
哈斯效应
哈斯效应是一个心理声学现象:如果你给左右耳放同样的声音,但其中一个加了延迟,那么在较小的延迟下人会觉得只有一个声音;反过来说,如果超过了那个较小延迟的阈值,人就可以听出来这是两个声音。
这个阈值一般认为是 30 ms 到 50 ms。也就是说 50 ms 是你甚至能直接听出来的延迟。
虽然视觉不能直接套用听觉上的结论,但相信你看了上面的例子,应该能明白 50 ms 其实是很长的一段时间。
我还想分享一个有意思的换算例子:
A 和 B 都是音乐人,他们一个住在中国,一个住在美国。他们想开视频通话一起排练,说好了 A 弹一个音的时候 B 也同时弹一个音。
中国到美国的距离约为 10,000 km,真空中光速约为 300,000 km/s,那么即使不考虑计算机、交换机、数据中心等等的延迟(实际情况下这些往往占了大部分延迟),A 把音频信号传到 B 那里也至少需要:
10,000 km / 300,000 km/s = 1 / 30 s = 33 ms
但 B 的音频信号也要走同样的路线回来,所以 A 听到 B 一起弹的那个音至少也是 67 ms 后了。这就是为什么基本没有人会用视频通话排练。即使只是在地球上,光速对于音乐人来说也已经不够用了。