声音播放的知识

矩阵 2004-7-26 15:31

Directsound 与 Waveout

Q: Directsound 与 Waveout 有何不同？

A: Waveout 是在32位的Windows上的一种老旧且过时，用来播放数字音讯的应用程序接口（Application Programming Interface，简称API）。旧的Windows操作系统（如Win9x WinNT4)在 Waveout 的完成度很高（因为 waveout 是针对这些操作系统设计的），如果你想获得最好的效能，你应该在这些操作系统上使用 Waveout输出。然而 Waveout 的功能有所局限，它无法支持「混和多重音讯流」的功能。这显示在Win2k/XP下的Waveout，只是为了旧的软件的兼容性所提供的，也因此Win2k/XP下 Waveout 的完成度很糟，它没有使用任何的硬件加速功能，所有的混音动作都是用软件来执行（因此当CPU的使用率很高时，常常会发生类似CD跳针的断音现象）。

Directsound 是种较新、较现代化的声音播放 API，都已经内建在最近的32位Windows操作系统中。 Directsound 支持混和多重音讯流、独立的音量控制、硬件加速层及硬件仿真层（如果某些功能硬件无法支持，可以用软件来仿真，因此程序设计师无须担心他们的新 l33t 码无法在旧的声霸卡16上运作）。一般来说，只要你的操作系统安装了适当的声卡驱动程序及最新的 DirectX，Direstsound 都应该可以运作的很好（除了WinNT4以外）。在Win2k/XP下，Directsound 比 waveout 更好，因为在这些操作系统里，Directsound 的完成度相对的比 waveout 来的更高（比 waveout 占用较少的CPU资源，自由度较高，且不会有 Waveout 常见的小毛病）。Directsound 原本是被设计来让游戏利用系统的硬件加速功能，而无须直接接触低阶的硬件函数（就如同 DirectX 其它的组件）。

Q: 为何 Directsound 总是比 waveout 来的小声？

A: 在Win2k/XP中，改变 waveout 的音量似乎会改变整体音量的设定，然而 Directsound 的音量是独立控制的。换句话说，你用 waveout 来播放音乐，你将音量设为50%，你就会得到50%的音量，然后你用 Directsound来播放，你将音量设为50%，你只会得到最大音量的25%。解决之道：别使用 waveout，并在Windows的音量控制中将音量设为最大。

Q: Directsound 及 waveout 之间的声音输出品质有所不同吗？

A1: 在Win2k/XP下（或者使用WDM驱动程序），waveout 及 Directsound 只有在传输 PCM 资料给 Windows kernel mixer 上有两点不同。waveout 只使用软件混音，因此较少造成系统中的特殊问题，而 Dircetsound可以使用硬件混音，因此会造成某些已知的，声音品质的问题。

A2: 在Win9x下，Directsound 驱动系统完全的与 waveout 分离，并使用低阶的方式来控制硬件，因此这就像拿两种不同的驱动程序来配合 waveout 及 Directsound。在使用某些老旧的ISA接口的声卡时，Directsound为了节省 ISA 总线的频宽，有着会将音讯资料降低取样率至 22khz 8bit （或者其它相近的取样率）的问题。

Q: 对于 Directsound 而言，软件混音及硬件混音有何不同？

A: 在 WinXP sp1、DirectX 8.1 中，无论是使用微软的 Directsound 核心或者是驱动程序来进行硬件混音，都很容易碰到问题。目前已经证实，在 Winxp 下使用硬件混音来传输音讯资料时，即使是使用不同的声卡，皆会碰上「取样频率」的问题。特别是某些驱动程序存在已久的问题（著名的创新未来 Audigy 声卡 Skipping问题，在某些设定中会出现不间断、静态的杂音，甚至在某些例子中，会发生声音品质骤降的情形，天晓得为何会如此！）。如果你想稳定的运作计算机，那建议你最好把硬件加速给关掉。硬件混音可以foobar2000 的偏好设定中的 Driectsound 这个字段里找到 "allow hardware acceleration"。开启它不代表你就真的激活了这个功能（Directsound 会在没有可用资源时自动使用软件混音）。

关于重新取样(resampling)

Q: 如果我使用重新取样的功能，能够增进(improve)声音的品质吗？

A: 不行，你无法利用重新取样来「增进」声音的品质，重新取样是个有耗损的过程。你可以试看看改变一张bmp 图片的大小，改过大小的图片会和原本的图片极为相似，不过假如你把两张图都放大(zoom-in)来看，你会发现它们在细节上并不相同。在某些硬件上，如果你使用高品质的重新取样软件，来避免让你的驱动程序/硬件处理重新取样的过程，你可以避免大量资料的损失（也就是避免音讯品质降低）。我知道某些人在他们的声霸卡16上将取样率提升为 96khz 24bit，并且声称这样能听到较「明亮」的声音（事实上 Windows kernel mixer会将取样率降回 44khz 16bit），别听他们所说的屁话。

Q: 我应该将重新取样的参数设为多少比较好？

A: 首先，你应该查询你声卡的硬件资料。某些声卡（例：在SB Awesome系列以前发售的声霸卡）不需要重新取样，这表示你不需要额外的重新取样就已经得到最好的品质了（不会有重新取样造成的品质降低）。所有的 SBLive!系列/Audigy系列/AC97兼容的声卡，都已经将输出的取样频率固定为 48khz，重新取样的品质会因为驱动程序/硬件装置/Windows混音设定而改变。在许多例子中，SSRC重新取样软件会优先于你的硬件/驱动程序，因此你需要将重新取样的参数设为 48khz/16bits，以避免你的硬件/驱动程序来进行它们较差的重新取样。

Q: 但是我在我的声霸卡上可以重新取样为 96khz/24bits ...

A: 当然可以，Windows混音器会将取样率降回你硬件能够接受的格式（例如： 48khz/16bits），这会造成额外的品质降低。不要提升取样率，除非你的硬件真的能够接受这些格式。Dithering dither 在计算机绘图上称为「递色」，而在处理音讯上，也有着相似的意思。以下有三张图，大家可以看看dither 的差异在何处。原始的图（24bit 高彩），左上角的小方块是从黑框中放大的。有 dither 的图（8bit 256色），较远处看可以说看不出与原图的差异。无 dither 的图（8bit 256色），色彩的分布不平顺，与原图可以看出根本的差异。启用这个功能，将会在播放波形时Dithering。如果dithering没有激活，那么foobar2000将会改用切平。这意指没有用到的位会被砍掉并丢弃。在许多较安静的音乐中有淡入或淡出的情况时，会造成「断裂」的听觉效果（也就是淡入/出的效果不平顺）。Dithering只有在你将高位（例如：32bit）的音讯以低位（例如：16bit）来播放时才真正有用。输出位设定(Output bit depth) 这里有个下拉式选单，可以让你选择输出的位率。如果你有张 24bit 的声卡，你当然会想让那些没有用到的位使用 dither to 24bit 来输出。即使是 16bit 的声卡，在播放 32bit 的音讯时使用 dither to 16bit 也能增进音质。foobar2000 处理音讯资料的管道如下——decoder(32 bit fp)=>[replaygain]=>[DSP]=>downsample to 16/24 bit with optional dithering 因此当你选择 dither to 16/24bit 时，建议你激活dithering。然而如果设为 32bit 是不需要激活dithering，因为从译码器直接传送过来的资料就是 32bit。

关于 Kernel Streaming

Q: 何谓 Kernel Streaming ？

A: Kernel Streaming 会绕过 Windows kernel mixer，直接输出音讯资料给声卡。这种方式有着较低的输出延迟，也许可以被视为 ASIO output 之外的另一种选择。

Q: 我应该用 Kernel Streaming 吗？

A: 如果你的声卡及驱动程序能支持，且你使用 Kernel Streaming 没有什么问题的情况下，我会建议你使用Kernel Streaming 。

Q: 为何使用 Kernel Streaming 来输出，比使用 Directsound 输出，感觉声音变的更大声或者明亮？

A: 声音并没有变的明亮，只有变大声。因为输出资料给声卡的方式不同，因为绕过了 Windows 的混音器，音量控制(wave)对于 Kernel Streaming 是无效的，而且都以最大音量来输出。如果你将音量控制中的 wave 音量设为最大，并使用 Directsound 输出，你会发现音质和 Kernel Streaming 输出没什么不同。

Q: 哪些操作系统可以使用 Kernel Streaming ？

A: Kernel Streaming 只能在 Windows 2000 及 Windows XP 上运作，有人说应该可以在Windows ME 上运作一打开 foobar2000, 你会发现它连 play, stop 这些基本的按钮都没有, 你可以到Foobar2000>Preferences>Display 里, 选 Show buttons, 接着到 DSP Manager, 把右边的 Resampler 移到左边, 然后在 DSP Manager 下的 Resampler 里, 把 Target sample rate 设定成你 soundcard 本身的sample rate 以下是一些建议数值 (参考自 DearHoney 的 RMAA 数据库):

44100 - SB16, AWE32, AWE64 和其它类似的 ISA soundcard
48000 - SB PCI, SBLive, Audigy1, Audigy2, Extigy, Philips AE, Sonic Fury, Yamaha 7x4 和一般的 onboard soundcard
96000 - Audigy2 和一些真正支持 96khz 的 soundcard, 例如 Terratec 的

在使用 Resampler 之后, 再试试播放上面提及的两个测试讯号, 听听是否只听到很纯很尖的超高频声音, 而且听不出两个档案的分别。如果是的话, 高质素的 src 已经成功了。否则请到foobar2000>preferences>Output 里, 试试选用不同的 Output, 如 Kernel Streaming (只限 WDM driver), 变更 DirectSound/WaveOut 里的各种设定再试试看, 如果仍然失败的话, 试试在 Windows 音量控制里按选项>进阶控制, 看看是否有高低音控制, 如果有的话, 把高低音都移到正中间再试试看 (如果本身已经在中间就不用移了), 如果还是不行的话, 我也无话可说。注意使用 Kernel Streaming 时 Windows 音量控制里的 wave 输出可能会无法控制, 那是正常的现象。接着到 Playback 一栏, 会有一个 Output bit depth 的选项, 只有 soundcard 真正支持 24-bit 时才选择 24-bit (Audigy1 是 16-bit, Audigy2 才是 24-bit), 因为在不支持 24-bit 的 soundcard 上选 24-bit 只会令音质比 16-bit 更差, 即使你可能听不出。

标签集:TAGS:

回复Comments() 点击Count()

回复Comments

{commentauthor}

{commenttime}

{commentnum}

{commentcontent}

作者:

{commentrecontent}

}