要玩转数字音乐,总免不了要跟一堆术语打交道:什么采样率啦,还有PCM、DSD、DoP、MQA这些格式。如果你还搞不清PCM 24bit/192kHz和32bit/384kHz有什么区别,搞不懂DSD128和DSD512谁更厉害,或者对MQA一头雾水,那么今天这篇内容千万别错过。
简单来说,一台设备能支持多高的采样率,基本决定了它能处理什么品质的声音。所以在挑选像DAC(数模转换器)这类器材时,看懂这些参数至关重要。
从模拟到数字
我们常说采样率,这本身就是个数字概念,但这些声音是怎么来的呢?这得先明白模拟音频和数字音频的区别。
录音的时候,有可能是直接录制电子合成的声音,也可能是真实乐队或人声。这些声音本质上,是电压随时间的变化而变化。比如你对着麦克风唱歌,它会把声波的振动转化成电信号的波动,这就是模拟信号。以前的磁带和黑胶唱片,记录的就是这种连续的波形。
但现在我们听的都是数字音频,计算机会把连续的模拟波形,切成无数个微小的片段,再转换成0和1的序列,这就是“采样”。负责这个转换过程的,就是ADC(模数转换器)芯片。
采样率与位深度:数字音频的两位主角
理解数字音频质量,关键看两个指标:采样频率和位深度。
采样频率(单位是kHz),相当于每秒采集多少个声音切片。采样率越高,记录下的波形就越接近原始模拟信号,声音自然越真实。
位深度(比如16bit、24bit),可以理解为动态范围的标尺。它决定了最轻和最响声音之间的层次有多细腻。位深度越高,音乐的动态就越宽广,细节也更丰富。像CD标准是16bit,而高解析度音频往往达到24bit或更高。
为什么是44.1kHz?
根据采样理论,要准确记录一个频率,采样率至少得是它的两倍。人耳的听觉范围大约是20Hz到20kHz,所以采样率至少需要40kHz。CD标准定为44.1kHz,就是在此基础上留了些余量。这个标准由索尼和飞利浦在1980年代初制定,一直沿用至今。
早期的CD上还有个“SPARS”代码,用A(模拟)和D(数字)来标明录音、混音和母带制作三个环节所用的技术,比如ADD就代表模拟录音、数字混音、数字母带。
数字时代的压缩:是为了存储和传播做的妥协
互联网兴起后,音乐文件需要通过网络传输。但早期的网速很慢,连CD质量的16bit文件都显得太大,更别说母带级的24bit了。于是,压缩技术应运而生。
有损压缩(如MP3、AAC):会直接舍弃一些人耳不太敏感的声音数据来减小体积。虽然效率高,但音质有损失,听起来会少些细节和质感。
无损压缩(如FLAC、ALAC):就像给音频文件打包成ZIP,所有数据都完好保留,解压后和原始文件一模一样,音质无损。

PCM、DSD、MQA,我们该怎么选?
现在常见的Hi-Res音频格式主要有这几类:
PCM(脉冲编码调制):这是最基础、最广泛的数字音频格式,CD用的就是它。它的原理很直接:对模拟信号进行采样、量化、编码。每个样本都独立处理,没有额外的压缩。你的DAC如果能支持高规格PCM(比如32bit/384kHz),就意味着它能以极快的速度进行采样,还原出非常平滑、接近模拟味的波形。
该技术不仅是CD质量音频的基准标准,更具备卓越的兼容性,可适配绝大多数数字音频系统与平台。但其对模拟信号的呈现并非完美无缺——在模拟声音转换为数字信号的过程中,会产生一种名为’量化噪声’的底噪。
你可以这么理解,比如我们要绘制一副风景画:通过逐个像素(微小方格)拼接就能构成完整图像。PCM的工作原理与此相似,它会以固定间隔对声音片段进行采样’捕捉’,并将其转化为数字数据。这种构成数字音频基石的编码方式,已被CD与绝大多数数字音频文件所采用。
但存在一个很小的瑕疵:当试图将这些’绘制’出的数字化声音还原为流畅自然的声波时,会产生某些噪声干扰。就像用微小方格绘制平滑曲线时,难免会呈现锯齿状的边缘。
DSD(全称Direct Stream Digital):这是PCM的竞争对手,由索尼和飞利浦为SACD(Super Audio CD)开发。它的思路很特别:用极高的采样率(比如CD的64倍),但每次只记录1bit的变化。这种方式不需要像PCM那样使用苛刻的滤波器,因此能非常柔和地重现高频,听感上更自然。DSD64、DSD128、DSD256这些数字,就代表采样率是CD的多少倍。
相较于PCM,DSD的核心优势在于更高的采样率能更精确呈现原始模拟信号。但DSD文件体积通常大于PCM,这对存储空间有限的用户可能造成困扰。我们再次以绘画为例:这次不再逐像素绘制,而是捕捉色彩间的渐变关系——比如天空与草地在蓝色调上的细微差异。DSD正是通过记录声音的变化轨迹而非声音本身来实现编码。
这种技术能生成高解析度音频文件,但需要以存储空间为代价。由于记录了极致细节,文件体积往往十分庞大。若设备存储空间有限,这可能会成为实际使用中的障碍。
DSD over PCM (简称DoP):这不是一种新格式,而是一种传输技巧。因为有些数字接口(比如光纤和同轴)天生只认PCM信号。DoP就是把DSD数据“伪装”成PCM流进行传输,到了设备端再还原成纯正的DSD,也是无损的。现在很多设备USB口都支持原生DSD了,但DoP在传统接口上依然很有用。
MQA(母带质量认证):这是一种为流媒体时代设计的格式。它的核心优势是压缩效率极高,能把高解析度音频文件体积缩小很多,方便在线传输。MQA文件内部是“折叠”起来的,需要支持MQA的硬件设备才能完全“展开”,释放全部音质潜力。如果设备不支持,它也能当作普通无损文件来播放。不过,关于MQA的音质是否真的更好,在发烧友中争议很大。
理解它的话,我们可以假设你想通过低速网络向朋友传送风景照片:既希望保持图像品质,又需要控制文件体积。这正是MQA的技术应用场景。这种新型音频编码能将高品质音频压缩至较小文件,极适合流媒体传输。但需要注意的是,要完全释放其技术潜力,必须确保音源平台与播放设备均支持MQA解码。
写在最后
关于哪种格式更好,一直是发烧圈里争论不休的话题。最靠谱的方法,还是用自己的设备去聆听比较不同格式的音乐,要相信你自己的耳朵。
最后,分享一段音乐人Brian Eno的话,或许能带来一些启发:
“那些在新格式刚出现时被我们嫌弃的“缺点”,比如数字音频的冰冷感、早期视频的卡顿感,往往在技术革新之后,反而会变成一种让人怀念的独特味道。这就像是失真吉他声,本质是信号过载的产物,却成了摇滚乐的灵魂;或者歌手唱到破音,那一刻的情感爆发反而最打动人心。这些所谓的“不完美”,恰恰记录了媒介在表现极限时迸发的独特魅力。“