音频及常用的格式

0.413字数 8420阅读 2757

要在计算机内播放或是处理音频文件,也就是要对声音文件进行数、模转换,这个过程同样由采样和量化构成,人耳所能听到的声音,最低的频率是从20Hz起一直到最高频率20KHZ,20KHz以上人耳是听不到的,因此音频文件格式的最大带宽是20KHZ,故而采样速率需要介于40~50KHZ之间,而且对每个样本需要更多的量化比特数。音频数字化的标准是每个样本16位-96dB的信噪比,采用线性脉冲编码调制PCM,每一量化步长都具有相等的长度。下面介绍几种常用的音频格式。

WAV

WAV为微软公司(Microsoft)开发的一种声音文件格式,它符合RIFF(Resource Interchange File Format)文件规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持,该格式也支持MSADPCM,CCITT A LAW等多种压缩运算法,支持多种音频数字,取样频率和声道,标准格式化的WAV文件和CD格式一样,也是44.1K的取样频率,16位量化数字,因此在声音文件质量和CD相差无几! WAV打开工具是WINDOWS的媒体播放器

通常使用三个参数来表示声音,量化位数,取样频率和采样点振幅。量化位数分为8位,16位,24位三种,声道有单声道和立体声之分,单声道振幅数据为n*1矩阵点,立体声为n*2矩阵点,取样频率一般有11025Hz(11kHz) ,22050Hz(22kHz)和44100Hz(44kHz) 三种,不过尽管音质出色,但在压缩后的文件体积过大!相对其他音频格式而言是一个缺点,其文件大小的计算方式为:WAV格式文件所占容量(B) = (取样频率 X量化位数X 声道) X 时间 / 8 (字节= 8bit) 每一分钟WAV格式的音频文件的大小为10MB,其大小不随音量大小及清晰度的变化而变化。

WAV是最接近无损的音乐格式,所以文件大小相对也比较大。

MP3

MP3是一种音频压缩技术,其全称是动态影像专家压缩标准音频层面3(Moving Picture Experts Group Audio Layer III),简称为MP3。它被设计用来大幅度地降低音频数据量。利用 MPEG Audio Layer 3 的技术,将音乐以1:10 甚至 1:12 的压缩率,压缩成容量较小的文件,而对于大多数用户来说重放的音质与最初的不压缩音频相比没有明显的下降。它是在1991年由位于德国埃尔朗根的研究组织Fraunhofer-Gesellschaft的一组工程师发明和标准化的。用MP3形式存储的音乐就叫作MP3音乐,能播放MP3音乐的机器就叫作MP3播放器。

MP3是利用人耳对高频声音信号不敏感的特性,将时域波形信号转换成频域信号,并划分成多个频段,对不同的频段使用不同的压缩率,对高频加大压缩比(甚至忽略信号)对低频信号使用小压缩比,保证信号不失真。这样一来就相当于抛弃人耳基本听不到的高频声音,[1]  只保留能听到的低频部分,从而将声音用1∶10甚至1∶12的压缩率压缩。由于这种压缩方式的全称叫MPEG Audio Player3,所以人们把它简称为MP3。

根据MPEG规范的说法,MPEG-4中的AAC(Advanced audio coding)将是MP3格式的下一代。MP3还分为耳机MP3和外放MP3两大类,传统MP3需要带耳机才有很好的音质,但是对人们的耳膜有所伤害,新型的MP3主要方向是外放MP3,对耳膜几乎没有任何伤害,从而得到人们的喜爱。

最高参数的MP3(320Kbps)的音质较之CD的,FLAC和APE无损压缩格式的差别不多,其优点是压缩后占用空间小,适用于移动设备的存储和使用。

MP3 PRO

MP3Pro是新一代的MP3格式,是Mp3编码格式的升级版本。MP3Pro是由瑞典Coding科技公司开发的,在保持相同的音质下同样可以把声音文件的文件量压缩到原有MP3格式的一半大小。而且可以在基本不改变文件大小的情况下改善原先的MP3音乐音质。它能够在用较低的比特率压缩音频文件的情况下,最大程度地保持压缩前的音质。

通常收听的mp3音乐文件一般都以128kbps的比特率压缩而成的。但如果采用更低的比特率(如96kbps或64kbps),我们可以非常明显的感觉到声音的高频部分丢失现象明显,严重时声音还会产生扭曲现象。这其中的原因在于,以这些低比特率压缩而成的mp3在编码时无法对声音的整个频带进行压缩,从而丢失了高频段一些重要的声音信息。

为了能够在低比特率下获得更高音质的mp3文件,一项称作SBR(Spectral Band Replication)的技术被用于新的mp3PRO编码中,其主要的用处在于保留了声音中的高频音,使得以低比特率压缩的mp3文件音质得到显著的增强。

mp3PRO在进行编码时,mp3PRO编码器将音频的录音分成两个部分:mp3部分和PRO部分。mp3部分分析低频段(Low Frequency Band)信息,并将其编码成通常的mp3文件数据流。这就使得编码器能够集中编码更少的有用信息,获得更佳品质的编码效果。同时,这也保证了mp3PRO文件同老的mp3播放器的兼容性。PRO部分分析的则是高频段(High Frequency Band)信息,并将其编码成mp3数据流的一部分,而这些通常在老的mp3解码器里是被忽略的。新的mp3PRO解码器会有效地利用这部分数据流,将两段(高频段和低频段)合并起来产生完全的音频带,达到增强音质的效果。

既然MP3存在的好好的,为什么会有MP3Pro的出现呢??这要从网络流媒体格式的出现说起。由于要在网络上收看声音和视频的需求不断增加,网络流媒体real和windowsmedia格式慢慢兴起。随着这些媒体的编码器不断改进,他们的质量已经不断提升,已经能够做到文件尺寸又小,质量又好,大有赶超MP3之势。以前MP3所倍受推崇的高压缩比,低质量损失已经不再是一张王牌,昔日辉煌的地位正在不断受到威胁。面对这一情况,Thomson Multimedia ,一个制作mp3编码格式的公司现今推出了一个MP3格式的升级版本----Mp3 Pro。

2001年6月14日,美国汤姆森多媒体公司(Thomson Multimedia SA)与佛朗赫弗协会(Fraunhofer Institute)于6月14日发布了一种新的音乐格式版本,名称为mp3PRO,这是一种基于mp3编码技术的改良方案,从官方公布的特征看来确实相当吸引人。从各方面的资料显示,mp3PRO并不是一种全新的格式,完全是基于传统mp3编码技术的一种改良,本身最大的技术亮点就在于SBR(Spectral Band Replication 频段复制),这是一种新的音频编码增强算法。它提供了改善低位率情况下音频和语音编码的性能的可能。这种方法可在指定的位率下增加音频的带宽或改善编码效率。SBR最大的优势就是在低数据速率下实现非常高效的编码,与传统的编码技术不同的是,SBR更像是一种后处理技术,因此解码器的算法的优劣直接影响到音质的好坏。高频实际上是由解码器(播放器)产生的,SBR编码的数据更像是一种产生高频的命令集,或者称为指导性的信号源,这有点駇idi的工作方式。我们可以看到,mp3PRO其实是一种mp3信号流和SBR信号流的混合数据流编码。有关资料显示,SBR技术可以改善低数据流量下的高频音质,改善程度约为30%,我们不管这个30%是如何得来的,但可以事先预知这种改善可以让64kbps的mp3达到128kbps的mp3的音质水平(注:在相同的编码条件下,数据速率的提升和音质的提升不是成正比的,至少人耳听觉上是这样的),这和官方声称的64kbps的mp3PRO可以媲美128kbps的mp3的宣传基本是吻合的。

APE

APE是流行的数字音乐无损压缩格式之一,因出现较早,在全世界特别是中国大陆有着广泛的用户群。与MP3这类有损压缩格式不可逆转地删除(人耳听力不敏感的)数据以缩减源文件体积不同,APE这类无损压缩格式,是以更精炼的记录方式来缩减体积,还原后数据与源文件一样,从而保证了文件的完整性。APE由软件Monkey's audio压制得到,开发者为Matthew T. Ashland,源代码开放,因其界面上有只“猴子”标志而出名。相较同类文件格式FLAC,ape有查错能力但不提供纠错功能,以保证文件的无损和纯正;其另一个特色是压缩率约为55%,比FLAC高,体积大概为原CD的一半,便于存储。

APE作为一种无损压缩音频格式,通过Monkey's Audio这个软件可以将庞大的WAV音频文件压缩为APE,,体积虽然变小了,但音质和原来一样。通过Monkey's Audio解压缩还原以后得到的WAV文件可以做到与压缩前的源文件完全一致。所以APE被誉为“无损音频压缩格式”,Monkey''s Audio被誉为“无损音频压缩软件”。

简单来讲,APE 压缩与WinZip或WinRAR这类专业数据压缩软件压缩原理类似,只是APE等无损压缩数字音乐之后的APE音频文件是可以直接被播放的。APE的压缩速率是动态的,压缩时只压缩可被压缩部分,不能被压缩的部分还是会保留下来。

FLAC

FLAC中文可解释为无损音频压缩编码。FLAC是一套著名的自由音频压缩编码,其特点是无损压缩。不同于其他有损压缩编码如MP3 及AAC,它不会破坏任何原有的音频资讯,所以可以还原音乐光盘音质。2012年以来它已被很多软件及硬件音频产品(如CD等)所支持.

FLAC与MP3不同,MP3是音频压缩编码,但FLAC是无损压缩,也就是说音频以FLAC编码压缩后不会丢失任何信息,将FLAC文件还原为WAV文件后,与压缩前的WAV文件内容相同。这种压缩与ZIP的方式类似,但FLAC的压缩比率大于ZIP和RAR,因为FLAC是专门针对PCM音频的特点设计的压缩方式。而且可以使用播放器直接播放FLAC压缩的文件,就象通常播放你的MP3文件一样(近几年已经有许多汽车播放器和家用音响设备支持FLAC,在FLAC的网站上你可以找到这些设备厂家的链接)。

FLAC是免费的并且支持大多数的操作系统,包括Windows,基于Unix Like内核( (Linux,BSD,Solaris,IRIX, AIX等)而开发的系统,BeOS,OS/2,Amiga。并且FLAC提供了在开发工具autotools,MSVC,Watcom C,Project Builder上的build系统。

AAC

AAC实际上是高级音频编码的缩写,苹果ipod、诺基亚手机也支持AAC格式的音频文件。AAC是由Fraunhofer IIS-A、杜比和AT&T共同开发的一种音频格式,它是MPEG-2规范的一部分。AAC所采用的运算法则与MP3的运算法则有所不同,AAC 通过结合其他的功能来提高编码效率。AAC的音频算法在压缩能力上远远超过了以前的一些压缩算法(比如MP3等)。它还同时支持多达48个音轨、15个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。总之,AAC可以在比MP3文件缩小30%的前提下提供更好的音质。

Real Media

从1997年RM出现算起,Real Media到现在已经陪伴我们十数个年头了。互联网大行其道之后,Real Media 出现了。这种文件格式几乎成了网络流媒体的代名词。RM/RMVB皆为封装RealMedia编码的特有格式(包括RealVideo和RealAudio),RA/RMA这两个文件类型就是Real Media里面向音频方面的格式。它们是由Real Networks公司发明的,特点是可以在非常低的带宽下(低达28.8kbps)提供足够好的音质让用户能在线聆听。这一特点在互联网的早期简直是广大网虫的福音。也就是因为出现了Real Media之后,相关的应用比如网络广播,网上教学,网上点播等等才浮出水面,形成了一个新的行业。

网络流媒体的道理其实非常简单,简单说就是将原来连续不断的音频分割成一个一个带有顺序标记的小数据包,将这些小数据包通过网络进行传递,在接收的时候再将这些数据包重新按顺序组织起来播放。如果网络质量太差,有些数据包收不到或者延缓了到达,它就跳过这些数据包不播放,以保证用户在聆听的内容是基本连续的。就是这么简单的道理,促成了网络上的又一个传奇。

由于Real Media是从极差的网络环境下发展过来的,所以Real Media的音质并不怎样,包括在高比特率的时候,甚至差于mp3。特别是有相当长的一段时间Real Networks公司只顾着往Real Media里面加入各种各样的新特性比如广告插播什么的,而忽略了随着网络速度的提升和宽带网的普及,用户对质量的要求也不断提高。后来Real Networks通过与SONY公司合作,利用SONY的ATRAC技术(http://www.minidisc.org/,也就是MD的压缩技术)实现高比特率的高保真压缩,但这些举措始终都带给用户一个姗姗来迟的感觉。由于Real Media的用途是在线聆听,并不适于编辑,所以相应的处理软件并不多。一些主流软件可以支持Real Media的读/写,可以实现直接剪辑的软件是Real Networks自己提供的捆绑在Real Media Encoder编码器中的Real Media Editor。但功能非常有限。这一点与现在的Windows Media相比是两个世界。

Windows Media

Windows Media是一种网络流媒体技术,隶属于微软。任何事情都少不了Microsoft的份。在意识到网络流媒体之于互联网的重要性之后,Microsoft立马就推出了Windows Media与Real Media相抗衡,同时开始对其他音频压缩技术说不:一律不提供直接支持。到了Windows XP版本还把原来提供的mp3压缩功能都拿掉了。

Windows Media 也是一种网络流媒体技术,本质上跟Real Media是相同的。但Real Media是有限开放的技术,比如rtsp(Real Time Stream Protocol实时流协议)这样的网络传输协议是提交到网络工作组RFC网络协议集的其中一个(编号RFC2326),而Windows Media则没有公开任何技术细节,据称是为了更好地进行版权保护,因此要完全封闭,还创造出一种名为mms(Multi-Media Stream多媒体流)的传输协议。所有这些事情综合起来可以看出Microsoft意图一统江湖的野心。

MIDI

MIDI(Musical Instrument Digital Interface)乐器数字接口 ,是20 世纪80 年代初为解决电声乐器之间的通信问题而提出的。MIDI是编曲界最广泛的音乐标准格式,可称为“计算机能理解的乐谱”。它用音符的数字控制信号来记录音乐。一首完整的MIDI音乐只有几十KB大,而能包含数十条音乐轨道。几乎所有的现代音乐都是用MIDI加上音色库来制作合成的。MIDI 传输的不是声音信号, 而是音符、控制参数等指令, 它指示MIDI 设备要做什么,怎么做, 如演奏哪个音符、多大音量等。它们被统一表示成MIDI 消息(MIDI Message) 。传输时采用异步串行通信, 标准通信波特率为31.25×( 1±0.01) KBaud。

MIDI发明者,是美国的加州音乐人,Dave Smith。

三十年前,音乐人没法同时操纵多个乐器,因为当时各种乐器是不可连接的。需要左右手同时弹奏两个键盘。此后,合成器制造商Dave Smith,说服了唱片商采用了一种叫做“乐器数字接口”(Musical Instrument Digital Interface,MIDI)的通用格式,这种格式能够让合成器受到外部键盘信号控制,可以由唱片商的竞争对手制作,甚至直接从电脑输出。使运算速度足够快的电脑处理音符采样,并能同时控制多个键盘和鼓机。

MIDI标准能让人们在自己家里进行音乐创作,使人们终于能够把合成器和鼓机连接到电脑上。于是,MIDI很快变成了连接各种型号的合成器、鼓机、采样数据和计算机的产业标准。

MIDI无论放置在哪里,都能在一个合成器上演奏些东西,并能在另外一个合成器上播放完全一样的声响。复杂而精心控制的的合成器声效、鼓机和采样样本见证了编曲技术从不可能到可能的转变。随着这种全新定义的制作方式,舞曲这种新的音乐类型诞生了。

第一台能够兼容MIDI格式的是一个由Dave Smith制作、叫做Prophet-900的合成器。它在1982年12月退役。 在当时的青少年游戏玩家中流行的Atari以及Commodore64型计算机也能通过一个5针的线缆控制另一端的MIDI乐器。

MIDI音乐格式,带有强烈的电子感,以及广泛适用性和便利性,催生了那个年代众多的音乐类型。重塑了1980年代的流行乐。

MIDI格式早期的的“开源精神”概念,让每个人都能创作”复杂的音乐片段”,MIDI标准的支持者推动它成为连接着着全世界的自由纽带。三十年以后,MIDI仍然强劲不衰,作为专业音乐录制和制作的关键组件而存续着。

OGG

Ogg全称是OGGVobis(oggVorbis)是一种音频压缩格式,类似于MP3等的音乐格式。Ogg是完全免费、开放和没有专利限制的。OggVorbis文件的扩展名是".ogg"。Ogg文件格式可以不断地进行大小和音质的改良,而不影响旧有的编码器或播放器。

MP3是有损压缩格式,因此压缩后的数据与标准的CD音乐相比是有损失的。VORBIS也是有损压缩,通过使用更加先进的声学模型去减少损失,因此,同样位速率(Bit Rate)编码的OGG与MP3相比听起来更好一些。另外,还有一个原因,MP3格式是受专利保护的(mp3专利费已经极低,诞生近20年快该过保护期了)。如果你想使用MP3格式发布自己的作品,则需要付给Fraunhofer(发明MP3的公司)专利使用费。而VORBIS就完全没有这个问题。对于乐迷来说想要高品质的音频,使用FLAC是个更好的选择,因为FLAC是无损压缩音频,又没有专利授权费用,现在很多播放器都加入了FLAC的行列,就连sony的顶级高解析音频播放器都已经支持。

优点1:Ogg Vorbis的音质和MP3不相上下,但无法和FLAC比。

由于Vorbis 使用了与MP3相比完全不同的数学原理,因此在压缩音乐时受到的挑战也不同。在聆听测试中,同样位速率编码的Vorbis 和MP3文件具有同等的声音质量。

如果两个文件都是以同样的位速率和CBR(常量位速率,指文件从头到尾都是一种位速率)方式来编码的话,那他们的大小肯定相同。当前 Vorbis 是以VBR方式编码的,(很久以前MP3也可以用VBR方式编码,除此以外还支持ABR(平局码率)方式,ABR方式可以事先确定大小的情况下获得尽可能好的音质,并且MP3支持通过左右声道联合立体声编码方式提高音质。)这使得Ogg的文件可以更小,因为VBR方式可以处理能大幅度进行压缩的音频数据(比如无声的时段)而节省空间。

优点2:Ogg Vorbis支持类似于MP3的ID3信息

Vorbis格式中包括有一个灵活而又完整的注释栏,可用于填写各种相关信息。

优点3:Ogg Vorbis格式支持流式播放

音频流是Vorbis的一个重要组成部分.vorbis格式从设计的一开始就是立足于可以容易地进行流式处理。并且,Vorbis的设计者正与Icecast流媒体软件的创造者一起使Icecast兼容Vorbis。

优点4:Ogg Vorbis避免了像MP3文件的ID3标记那样烦琐的操作(有很多针对MP3的ID3修改软件标记早已不繁琐)

Vorbis具有一个设计良好、灵活的注释,避免了像MP3文件的ID3标记那样烦琐的操作;Vorbis还具有位速率缩放:可以不用重新编码便可调节文件的位速率。Vorbis文件可以被分成小块并以样本粒度进行编辑;Vorbis支持多通道; Vorbis文件可以以逻辑方式相连接等。

缺点1:播放兼容性差。mp3已经成了便携随身听的代名词。绝大多数播放器、包括手机、pad等设备都支持mp3格式(其实mp3专利芯片授权费极低),而支持ogg格式的播放器很少。

缺点2:mp3是1997年以前就已经诞生,将近20年垄断了消费机市场。ogg音频普及性非常差,相对于mp3而言音质也没有竞争力,普及的可能性极低。

缺点3:相对于已经普及的微软WMA格式,ogg没有任何优势。不管是播放软件兼容性,码率,流媒体等方面。

缺点4:多声道系统已经由DOLBY、DTS两家公司垄断,他们都有完整的制作发行体系。大型多声道电影、电视、音乐制作都是基于这两家公司的技术和标准。ogg只能望洋兴叹了。

缺点5:很多专业音频制作软件不支持ogg文件格式。

缺点6:现今HIFI已经被HIRES(高解析)代替,随着存储、网速等限制,用户的聆听设备已经上了一个台阶,有损格式已经渐渐失去市场。

VQF

VQF指的是TwinVQ(Transform-domain WeightedI Nterleave Vector Quantization),VQF是一种音频压缩技术。VQF所采用的是一种称为“矢量化编码(vectorquantization)”的压缩技术。对计算机的配置要求为奔腾75或更高。

VQF格式实际指的是TwinVQ(transform-domain weighted interleave vector quantization),是日本ntt(nippon telegraph and telephone)集团属下的ntt human interface laboratories开发的一种音频压缩技术。VQF格式技术受到yamaha公司的支持,vqf是其文件的扩展名。VQF格式和mp3的实现方法相似,都是通过采用有失真的算法来将声音进行压缩,不过VQF格式与mp3的压缩技术相比却有着本质上的不同:VQF格式的目的是对音乐而不是声音进行压缩,因此,VQF格式所采用的是一种称为“矢量化编码(vector quantization)”的压缩技术。该技术先将音频数据矢量化,然后对音频波形中相类似的波形部分统一与平滑化,并强化突出人耳敏感的部分,最后对处理后的矢量数据标量化再进行压缩而成。

VQF使用范围从电话、AM短波乃至音频CD;从单声道信号到立体声信号,它都能提供了很好的编码/压缩支持。还有纠错能力。VQF特别提供了一个纠错环境来处理数据错误及帧丢失的情况。它使用修正帧频率技术,然后强化矢量量化以保证音质。

MOD

MOD是一种类似波表的音乐格式,但它的结构却类似 MIDI,使用真实采样,体积很小,在以前的DOS年代,MOD经常被作为游戏的背景音乐。现在的MOD可以包含很多音轨,而且格式众多,如S3M、NST、669、MTM、XM、IT、XT和RT等。

Module(简称mod)是数码音乐文件,由一组samples(乐器的声音采样)、曲谱和时序信息组成,告诉一个mod播放器何时以何种音高去演奏在某条音轨的某个样本,附带演奏一些效果比如颤音等。因而mod与纯正的象WAV或AU那样的没有包含时序信息的样本文件不同,与象MIDI文件那样的不携带任何附加样本/乐器的文件也不同(与现在支持DLS技术的MIDI倒是有点相似,不过mod的体积要比DLS MIDI小得多。)。

mod起源于Amiga计算机,当时的文件扩展名是MOD,为了区分具体的类型和整个结构体系,通常使用MOD来表示整个Module格式体系。

由于该格式起源很早,因此曾经非常流行,因为mod提供了一种具有可以接受的音质水平而又非常廉价的制作音乐的方法。而且这种文件的音质效果对于当时的电脑硬件水平来说效果比MIDI要好,文件的体积也不大,好处是显而易见的。随着高质量的音响硬件的使用,新一代的mod的声音质量甚至可以提升到接近专业设备的水平。这使得mod成为一种介乎于象WAV或VOC那样的纯正样本数据文件和象General MIDI那样的纯正时序信息文件之间的混合体,成为一种比较灵活的音频格式。

但是,mod的最大缺点是具体的格式变化太多。由于原本的MOD格式只支持4条音轨,而且MOD格式并没有版权限制,导致后来涌现了一大堆在MOD的基础上改进而来的格式,比如xm这种支持高达32条音轨128种采样的格式。但由于mod格式的不统一,最终结果就是这种格式在商业领域没有多大的作为。Windows平台上曾经有一个非常好的播放器名为MOD4WIN,后来也停止了开发。目前支持播放Mod的播放器主要有WinAMP。

Monkey's audio

Monkey's Audio这款软件并不是由什么大公司发明的,完全是一个个人业余兴趣作品。

为了使Monkey's Audio能有更好的发展,现在这个软件已经公开了源代码

这种压缩格式的特点是无损压缩,也就是说对压缩数据进行还原之后得到的数据与原来的数据是完全相同的。该格式的特点尤其适合那些拥有一对“金耳朵”并且一直对mp3的音质耿耿于怀的音乐发烧友。

使用普通的压缩软件进行压缩无疑是可以得到不错的压缩效果,有时候甚至更优于使用Monkey's Audio,但是压缩软件生成的压缩包必须要先解压还原之后才能播放里面的内容,而Monkey's Audio这种无损压缩编码得到的文件可以直接使用播放器(比如WinAMP)进行播放。

Monkey's Audio的压缩效果大约在2:1左右,也就是说压缩结果是原来的二分之一大小。一张CD的存储空间大约在680MB左右,在经过Monkey's Audio压缩之后的文件大约需要330MB左右的空间存放,相比之下还是比较占空间的。由于这个原因,所以对音质要求不是太高的人通常都选择VBR方式的mp3而不是选择它。

与Monkey's Audio类似的编码格式还包括WavPack、RKAU、Shorten等等。由于相对不是那么出名,又或者在某些方面不够Monkey's Audio做得好,因此获得的关注程度就逊色很多。

AIFF

Apple苹果电脑(http://www.apple.com)上面的标准音频格式,属于QuickTime技术(http://www.apple.com/quicktime)的一部分。这一格式的特点就是格式本身与数据的意义无关,因此受到了Microsoft的青睐,并据此搞出来WAV格式。AIFF虽然是一种很优秀的文件格式,但由于它是苹果电脑上的格式,因此在PC平台上并没有得到很大的流行。不过由于Apple电脑多用于多媒体制作出版行业,因此几乎所有的音频编辑软件和播放软件都或多或少地支持AIFF格式。只要苹果电脑还在,AIFF就始终还占有一席之地。

由于AIFF的包容特性,所以它支持许多压缩技术。这里顺带说说的是在苹果平台上原生的流媒体压缩技术是QDesign公司(http://www.qdesign.com)的QDMC,QDesign

Music Codec。据官方资料介绍,QDesign Music

Codec 2能在全带宽立体声的设置下将音频压缩为原来的百分之一大小。与其他纯粹基于知觉音频编码技术(mp3等)不同的是,QDesign

Music Codec 2使用了新的专利的算法技术,因此,可以在modem的速度上达到相当的音频质量。该技术最大支持128kbps。

AU

AU是UNIX系统开发的一种音乐格式,起源于Sun公司(http://www.sun.com)的Solaris系统.

这是为UNIX系统开发的一种音乐格式,和WAV非常相像,在大多数的音频编辑软件中也都支持它们这几种常见的音乐格式。在JAVA自带的类库中能得到播放支持。

voc

创新公司(Creative)的声音卡成了PC平台上的多媒体声音卡事实标准的时候,VOC格式也跟同着成为了DOS系统下面的音频文件格式标准。因为它是创新公司发明的音频文件格式。由于该格式属于硬件公司的产品,因此不可避免地带有浓厚的硬件相关色彩。这一点随着Windows平台本身提供了标准的文件格式WAV之后就变成了明显的缺点。加上Windows平台不提供对VOC格式的直接支持,所以VOC格式很快便消失在人们的视线中。不过很多播放器和音频编辑器都还是支持该格式的。

推荐阅读更多精彩内容