那些疯狂的小事儿

逝者如斯
网志分类
· 所有网志 (17)
· 教育小札 (1)
· 心灵小语 (6)
· 玉米呓语 (1)
· 我爱读书 (4)
· 信息科技 (1)
· 未分类 (4)
搜索本站
友情链接
· 我的歪酷

订阅 RSS

0004178

歪酷博客


« 上一篇: 归心似箭 下一篇: 认知疗法 »
yaya @ 2006-02-20 11:04

 

一、MIDIMIDI的基本原理

我们可以把一大堆乐器的音色先录下来,然后每个音色给它一个编号。比如Acoustic Piano编号为00。接着再给所有的音高也用一串编号表示(因为我们通常用的是12平均律),比如C3音我们编号为00。剩下就是音符的时值问题,我们可以把8分音符编号为60。好, 现在如果要一个原声钢琴8分音符的C3音,就可以用一串数字"00 00 60"来表示。

MIDI是英语Music Instrument Digital Interface 的缩写,经过翻译就是“数字化乐器接口”,也就是说它的真正涵义是一个供不同设备进行信号传输的接口的名称。我们如今的MIDI音乐制作全都要靠这个接口,在这个接口之间传送的信息也就叫MIDI信息。

  MIDI是怎样把音乐制作出来的呢,有哪些有关的设备呢?

  在MIDI音乐的制作过程中始终离不开三件“宝贝”:输入设备,音序器和音源。

  通俗地说,音源就是一个装了很多音色的东西,我们要听到音乐就必须靠它提供音色,不同的音源能提供不同的音色,当然就有好有坏,有高档和低档了。采样器实际上也是音源的一种,只不过它的音色不是固定的,而是来自于各类采样盘或是您的亲手劳动——自己采样。

  但是音源其实也不会很聪明,因为它自己不知道该在什么时候用什么音色发多长的音,它好比只是一个丰富的矿藏,至于如何利用不是音源的工作,必须有另一个设备来指挥它,这个设备就是MIDI制作的心脏——音序器。音序器的任务就是记录下人的旨意,实际上就是记录了音乐的基本要素——速度,节奏,音色,音符的时值等等,这样在播放的过程中,音序器就会根据其内容指挥音源在什么时候用什么音色发多长的音,这样我们就能听到一首动听的歌曲了。

至于输入设备也是很容易理解,就是把要演奏的内容告诉音序器!为了符合我们原有的演奏习惯,人们制造了许多基于传统乐器的MIDI输入设备,如MIDI键盘,MIDI吉它,MIDI吹管,MIDI小提琴等,我们可以按照演奏传统乐器的方法去演奏它们,而我们的演奏则通过MIDI OUT出口传送到音序器,被记录为音序内容。所以可以说MIDI文件的内容实际上就是音序内容,它只是一堆数字而已,大家如果在Cakewalk 这样的软件中打开Event list 所看到的东西就是MIDI音乐的内容了。所以MIDI文件的体积是很小的,一般只有几十KB,很适合在网络上传播。但正是因为MIDI文件不是以描述声音的波形为其记录形式的,所以同样的一个MIDI文件在不同的音源上播放效果会完全不一样,因为声音是靠音源发出的,而不同的声卡波表或硬件的音源音色都不一样。

 

 

经典的WAVE

WAVE文件作为最经典的Windows多媒体音频格式,应用非常广泛,它使用三个参数来表示声音:采样位数、采样频率和声道数。

声道有单声道和立体声之分,采样频率一般有11025Hz11kHz)、22050Hz22kHz)和44100Hz44kHz)三种。WAVE文件所占容量=(采样频率×采样位数×声道)×时间/81字节=8bit)。

 

 

传统的MOD

MOD是一种类似波表的音乐格式,但它的结构却类似 MIDI,使用真实采样,体积很小,在以前的DOS年代,MOD经常被作为游戏的背景音乐。现在的MOD可以包含很多音轨,而且格式众多,如S3MNST669MTMXMITXTRT等。

 

电脑音乐MIDI

MIDIMusical Instrument Data Interface的简称,它采用数字方式对乐器所奏出来的声音进行记录(每个音符记录为一个数字),然后,播放时再对这些记录通过FM或波表合成:FM合成是通过多个频率的声音混合来模拟乐器的声音;波表合成是将乐器的声音样本存储在声卡波形表中,播放时从波形表中取出产生声音。

 

龙头老大MP3

MP3可谓是大名鼎鼎,它采用MPEG Audio Layer 3 技术,将声音用 110 甚至 112 的压缩率压缩,采样率为44kHz、比特率为112kbit/s

MP3音乐是以数字方式储存的音乐,如果要播放,就必须有相应的数字解码播放系统,一般通过专门的软件进行MP3数字音乐的解码,再还原成波形声音信号播放输出,这种软件就称为MP3播放器,如Winamp等。

 

网上霸主RA系列

RARAMRM都是Real公司成熟的网络音频格式,采用了“音频流”技术,所以非常适合网络广播。在制作时可以加入版权、演唱者、制作者、Mail 和歌曲的Title等信息。

RA可以称为互联网上多媒体传播的霸主,适合于网络上进行实时播放,是目前在线收听网络音乐最好的一种格式。

 

高压缩比的VQF

VQFTwinVQ是由Nippon Telegraph and TelephoneYAMAHA公司开发的一种音频压缩技术。

VQF的音频压缩率比标准的MPEG音频压缩率高出近一倍,可以达到118左右甚至更高。而像MP3RA这些广为流行的压缩格式一般只有112左右。但仍然不会影响音质,当VQF44kHz-80kbit/s的音频采样率压缩音乐时,它的音质会优于44kHz-128kbit/sMP3,以44kHz-96kbit/s压缩时,音乐接近44kHz-256kbit/sMP3

 

迷你光盘MD

MD(即MiniDisc)是SONY公司于1992年推出的一种完整的便携音乐格式,它所采用的压缩算法就是ATRAC技术(压缩比是15)。MD又分为可录型MDRecordable,有磁头和激光头两个头)和单放型MDPre-recorded,只有激光头)。

强大的编辑功能是MD的强项,可以快速选曲、曲目移动、合并、分割、删除和曲名编辑等多项功能,比CD更具个性化,随时可以拥有一张属于自己的MD专辑。MD的产品包括MD随身听、MD床头音响、MD汽车音响、MD录音卡座、MD摄像枪和MD驱动器等。

 

音乐CD

CD唱片,一张CD可以播放74分钟左右的声音文件,Windows系统中自带了一个CD播放机,另外多数声卡所附带的软件都提供了CD播放功能,甚至有一些光驱脱离电脑,只要接通电源就可以作为一个独立的CD播放机使用。

 

潜力无限的WMA

微软在开发自己的网络多媒体服务平台上主推ASF(Audio Steaming format),这是一个开放支持在各种各样的网络和协议上的数据传输的标准。它支持音频、视频以及其他一系列的多媒体类型。而WMAWindows Media Audio的缩写,相当于只包含音频的ASF文件。

WMA文件在80kbps44kHz的模式下压缩比可达118,基本上和VQF相同。而且压缩速度比MP3提高一倍。所以它应该比VQF更具有竞争力。

 

免费音乐格式Vorbis

为了防止MP3音乐公司收取的专利费用上升,GMGIiCast公司的程序员开发了一种新的免费音乐格式Vorbis,其音质可以与MP3相媲美,甚至优于MP3。并且将通过网络发布,可以免费自由下载,不必担心会涉及侵权问题。但MP3在网上已经非常流行,微软的Windows Media技术也开始普及,Vorbis的前景还是不容乐观。

 

其它音频格式

AIF/AIFF:苹果公司开发的一种声音文件格式,支持MAC平台,支持1644.1kHz立体声。

AUSUNAU压缩声音文件格式,只支持8位的声音,,是互连网上常用到的声音文件格式,多由SUN工作站创建。

CDACD音轨文件。

CMFCREATIVE 公司开发的一种类似MIDI的声音文件。

DSPDigital Signal Processing(数字信号处理)的简称。通过提高信号处理方法,音质会极大地改善,歌曲会更悦耳动听。

S3UMP3播放文件列表

RMIMIDI乐器序列

有损压缩:

AAC:在高比特率下音质仅次于MPC,在高比特率和低比特率下表象都很不错。就是编码速度太慢!

MPC:低比特率下表现一般,不及Mp3Pro编码的MP3OGG,高比特率下音质最好,编码速度快!

OGG:低比特率下音质最好,高比特率同样也不错。编码速度稍慢。

MP3(MP3Pro):在低比特率下音质次于OGG,其他方面同MP3

WMA:高低比特率下都一般,不支持VBR,最高192Kbit/s

无损压缩:

FLAC:压缩率在四个中最差,编码速度不错,平台支持很好。

PAC:稍慢的编码速度,压缩率排第三,平台支持良好。

APE:编码速度最快、最好的压缩率,平台支持一般。

WV:编码速度非常快,压缩率在四个种排第二,仅支持Windows平台。

 

 

三、音频文件格式全介绍

 

 

 

 

 

 

 

 

音频文件格式全介绍

 

 

 

 

  自从PC支持多媒体以来,陆陆续续地出现了许多音频格式。这些格式既有流行的也有不那么流行的,关于它们的来龙去脉,本文向你一一道来。

 

 

主流

 

 

  目前的主流音频格式其实不少。不同的格式有自己的用途,比如大家都应该很熟悉的MP3格式就是用于聆听用途的。下面我们逐一介绍:

 

 

存在便是永恒 - WAV

 

 

  WAVMicrosoft Windows本身提供的音频格式,由于Windows本身的影响力,这个格式已经成为了事实上的通用音频格式。不客气地说,它实际上是Apple电脑的AIFF格式的克隆。通常我们使用WAV格式都是用来保存一些没有压缩的音频,但实际上WAV格式的设计是非常灵活(非常复杂)的,该格式本身与任何媒体数据都不冲突,换句话说,只要有软件支持,你甚至可以在WAV格式里面存放图像。之所以能这样,是因为WAV文件里面存放的每一块数据都有自己独立的标识,通过这些标识可以告诉用户究竟这是什么数据。在WINDOWS平台上通过ACMAudio Compression Manager)结构及相应的驱动程序(在这里通常称为CODEC,编码/解码器),可以在WAV文件中存放超过20种的压缩格式,比如ADPCMGSMCCITT G.711G.723等等,当然也包括MP3格式。

 

 

 

 

图表 - 使用音频编辑软件WaveCNhttp://www.wavecn.com)列出Windows安装了的ACM驱动信息

 

 

  虽然WAV文件可以存放压缩音频甚至mp3,但由于它本身的结构注定了它的用途是存放音频数据并用作进一步的处理,而不是像mp3那样用于聆听。目前所有的音频播放软件和编辑软件都支持这一格式,并将该格式作为默认文件保存格式之一。这些软件包括:Sound Forge, Cool Edit Pro, WaveLab等等。由于WAV的支持实在是太广泛了,可以说,即使Windows退出历史舞台,WAV格式也不会消亡。

 

 

老当益壮 mp3

 

 

  第二个要提到的就是改变了世界的mp3了。这个比喻相信大家都会同意。mp3Fraunhofer-IIS研究所(http://www.iis.fhg.de/)的研究成果。mp3是第一个实用的有损音频压缩编码。在mp3出现之前,一般的音频编码即使以有损方式进行压缩能达到4:1的压缩比例已经非常不错了。但是,mp3可以实现12:1的压缩比例,这使得mp3迅速地流行起来。mp3之所以能够达到如此高的压缩比例同时又能保持相当不错的音质是因为利用了知觉音频编码技术,也就是利用了人耳的特性,削减音乐中人耳听不到的成分,同时尝试尽可能地维持原来的声音质量。

 

 

 

 

图表 - 人耳等响度曲线图,mp3的技术基础。

 

 

  衡量mp3文件的压缩比例通常使用比特率来表示。这个术语的英文是bps: bit per second,表示每1秒钟的音频可以用多少个二进制比特来表示。通常比特率越高,压缩文件就越大,但音乐中获得保留的成分就越多,音质就越好。由于比特率与文件大小音质的关系,所以后来又出现了vbrVariant Bitrate 可变比特率)方式编码的mp3,这种编码方式的特点是可以根据编码的内容动态地选择合适的比特率,因此编码的结果是在保证了音质的同时又照顾了文件的大小,结果大受欢迎。其实mp3的编码标准本来就支持这种压缩方式,但是第一个将此功能实现的反而是一个第三方工具:曾经非常有名的Xing Technology公司(http://www.xingtech.com,当年很多电脑上看VCDmp3就靠这个公司的Xing Player)推出的Xing Encoder

 

 

  由于mp3是世界上第一个有损压缩的编码方案,所以可以说所有的播放软件都支持它,否则就根本没有生命力。在制作方面,也曾经产生了许多第三方的编码工具。不过随着后来Fraunhofer-IIS宣布对编码器征收版税之后很多都消失了。目前属于开放源代码并且免费的编码器是LAME (Lame Ain't Mp3 Encoderhttp://lame.sourceforge.net)。这个工具是公认的压缩音质最好的mp3压缩工具。另外,几乎所有的音频编辑工具都支持打开和保存mp3文件。最近,Fraunhofer-IIS对之前不收取版权费的mp3解码器也征收了版权费。此举大有Fraunhofer-IIS意识到mp3已经在没落,趁还能收到钱最后捞一把的意思。应该说,到了现在,MP3确实显现出疲态了。许多新一代的编码技术都已经能在相同的比特率下提供比MP3优越得多的音质。特别是音乐发烧友对mp3的音质更是嗤之以鼻。不过由于mp3的影响力实在是太大了,支持mp3的软件多如牛毛,更别提众多支持mp3的硬件播放器,如MPMANDiscManCD/VCD/DVD机等等。一句话,它依然是世界上最流行的音频压缩技术,所以要它真正退出舞台相信还有好一段时间。

 

 

 

 

图表 - Lame的其中一个前端:RazorLamehttp://www.dors.de/razorlame

 

 

老树发新花 - mp3PRO

 

 

  为了使mp3能在未来仍然保持生命力,Fraunhofer-IIS研究所连同Coding Technologies 公司(http://www.codingtechnologies.com)还有法国的Thomson multimedia公司(http://www.thomson.net)共同推出了mp3PRO。这种格式与之前的mp3相比最大的特点是能在低达64kbps的比特率下仍然能提供近似CD的音质(mp3128K)。该技术称为SBR(Spectral Band Replication),它在原来mp3技术的基础上专门针对原来mp3技术中损失了的音频细节进行独立编码处理并捆绑在原来的mp3数据上,在播放的时候通过再合成而达到良好的音质效果。

 

 

 

 

图表 - SBR技术在音频编码/解码过程中的应用

 

 

  mp3PRO格式与mp3是兼容的,所以它的文件类型也是mp3mp3PRO播放器可以支持播放mp3PRO或者mp3编码的文件;普通的mp3播放器也可以支持播放mp3PRO编码的文件,但只能播放出mp3的音质。但是,虽然mp3PRO是一种优秀的技术,由于技术专利费用的问题以及其他技术提供商比如Microsoft的竞争,mp3PRO并没有得到很大的流行。大家可以从Coding Technologies的网站下载Demo播放/压缩工具和Winamp的播放插件。目前也有许多专业音频编辑软件比如Cool Edit Pro 2.0支持mp3PRO格式,但播放器除了刚才说的和Music Match Juke Box就基本没有了。最关键的是由于Microsoft的媒体播放机不支持,使得mp3PRO失去了流行的机会。前段时间Coding Technologies推出了最新的MPEG-4 aacPlus,通过将SBR技术应用在AACAdvanced Audio Codec)技术中而获得更卓越的音质。Coding Technologies并表示SBR将会成为MPEG-4的核心技术。但缺乏支持的技术到底能走多远,谁也不清楚。

 

 

 

 

图表 - THOMSON mp3PRO 播放器

 

 

网络流媒体鼻祖 - Real Media

 

 

  互联网大行其道之后,Real Media 出现了。这种文件格式几乎成了网络流媒体的代名词。RARMA这两个文件类型就是Real Media里面向音频方面的。它是由Real Networks公司(http://www.realnetworks.com)发明的,特点是可以在非常低的带宽下(低达28.8kbps)提供足够好的音质让用户能在线聆听。这一特点在互联网的早期简直是广大网虫的福音。也就是因为出现了Real Media之后,相关的应用比如网络广播,网上教学,网上点播等等才浮出水面,形成了一个新的行业。

 

 

  网络流媒体的道理其实非常简单,简单说就是将原来连续不断的音频分割成一个一个带有顺序标记的小数据包,将这些小数据包通过网络进行传递,在接收的时候再将这些数据包重新按顺序组织起来播放。如果网络质量太差,有些数据包收不到或者延缓了到达,它就跳过这些数据包不播放,以保证用户在聆听的内容是基本连续的。就是这么简单的道理,促成了网络上的又一个传奇。

 

 

  由于Real Media是从极差的网络环境下发展过来的,所以Real Media的音质并不怎样,包括在高比特率的时候,甚至差于mp3。特别是有相当长的一段时间Real Networks公司只顾着往Real Media里面加入各种各样的新特性比如广告插播什么的,而忽略了随着网络速度的提升和宽带网的普及,用户对质量的要求也不断提高。后来Real Networks通过与SONY公司合作,利用SONYATRAC技术(http://www.minidisc.org/,也就是MD的压缩技术)实现高比特率的高保真压缩,但这些举措始终都带给用户一个姗姗来迟的感觉。由于Real Media的用途是在线聆听,并不适于编辑,所以相应的处理软件并不多。一些主流软件可以支持Real Media的读/写,可以实现直接剪辑的软件是Real Networks自己提供的捆绑在Real Media Encoder编码器中的Real Media Editor。但功能非常有限。这一点与现在的Windows Media相比是两个世界。

 

 

 

 

图表 - Real One Player, 最新的Real Media播放器

 

 

霸气十足 - Windows Media

 

 

  任何事情都少不了Microsoft的份。在意识到网络流媒体之于互联网的重要性之后,Microsoft立马就推出了Windows MediaReal Media相抗衡,同时开始对其他音频压缩技术说不:一律不提供直接支持。到了Windows XP版本还把原来提供的mp3压缩功能都拿掉了。

 

 

  Windows Media http://www.microsoft.com/windows/windowsmedia)也是一种网络流媒体技术,本质上跟Real Media是相同的。但Real Media是有限开放的技术,比如rtspReal Time Stream Protocol实时流协议)这样的网络传输协议是提交到网络工作组RFC网络协议集的其中一个(编号RFC2326),而Windows Media则没有公开任何技术细节,据称是为了更好地进行版权保护,因此要完全封闭,还创造出一种名为mmsMulti-Media Stream多媒体流)的传输协议。所有这些事情综合起来可以看出Microsoft意图一统江湖的野心。

 

 

  最初版本的Windows Media并没有得到什么好评,特别在音质方面更被网络上那些金耳朵的网友所不齿。不过在更新了几个版本之后,目前最新的Windows Media 9技术携带着大量的新特性并在Windows Media Player的配合下表现已经不可同日而语。特别在音频方面,Microsoft是唯一一个能提供全部种类音频压缩技术(无失真、有失真、语音)的解决方案,大有囊括一切的势头。这也是微软的一贯特色:虽然我的东西质量不是最好的,但肯定是最方便,集成度最高的。目前Windows Media还是处于推广期,播放器和编码器可以免费下载,服务器端捆绑在Windows服务器版中,不另外收费。这些手段正在不断提升其市场占有率。而且由于Microsoft的影响力,支持Windows Media的软件非常多。虽然它也是用于聆听用途,不能编辑,但几乎所有的Windows平台的音频编辑工具都对它提供了读/写支持,至于第三方播放器更是无一例外了,连Real Player都支持其播放。通过Microsoft 自己推出的Windows Media File Editor可以实现简单的直接剪辑。最近,Microsoft还推出了Windows XP Media Center版本,通过在Windows XP中捆绑Windows Media 9技术以及相关娱乐媒体软件来加强Windows作为家庭娱乐中心的作用。如果Microsoft继续保持其在操作系统特别是桌面操作系统的垄断地位的话,Windows Media的未来肯定是一片光辉。

 

 

 

 

图表 - 最新的Windows Media Player 9,带有大量的网络特性

 

 

电脑与电子乐器的桥梁 MIDI

 

 

  MIDI技术本来不是为了电脑发明的。该技术最初应用在电子乐器上用来记录乐手的弹奏,以便以后重播。不过随着在电脑里面引入了支持MIDI合成的声音卡之后MIDI才正式地成为了一种音频格式。有很多人都误以为MIDI是用来记谱的,这是错的。MIDI的内容除了乐谱之外还记录了每个音符的弹奏方法,所以有些MIDI文件播放起来不好听,而某些则有良好的效果。MIDI本身也有两个版本,General MIDIGeneral MIDI 2。在MIDI上还衍生了许多第三方的非标准技术,比如非常著名的:X-MIDI(或者叫XG),这是由日本YAMAHA公司(http://www.yamaha.com)发明的,在原有的MIDI具有128种乐器的基础上扩充到了512种,并增加了更多的演奏控制,配合YAMAHA自己的波表播放软件或支持X-MIDI的硬件可以还原出非常动听和接近真实乐器效果的音乐。另外就是为了弥补MIDI中通过声音合成得到的乐器声音始终比不上真实乐器声音这一缺点而由General MIDI AssociationMIDI规范的国际组织,http://www.midi.org)推出的DLS(Downloadable Sound)技术,该技术通过给MIDI文件附带上真实乐器的录音(采样)而使MIDI文件能营造出接近真实乐器效果的声音,不过该技术的主要问题是带上乐器采样之后的MIDI文件实在是太大了,通常情况下都有4兆字节以上(这样的大小用户当然是去找mp3了),影响了该技术的普及。

 

 

  由于MIDI具有的优点和特殊性,因此可以相信这是一种在相当长的时间里都会继续存在的技术。普通的MIDI文件许多播放器都支持,但要达到好的效果就必须安装软波表,比如曾经很出名的WinGrooveRoland Virtual Sound CanvasYAMAHA S-YXG Player。随着MicrosoftRolandhttp://www.roland.com)合作在DirectX里面增加了DirectMusic之后软波表就变成了Windows系统的标准配置了。需要注意的是对于X-MIDI格式来说必须使用YAMAHA自己推出的播放器才能得到良好的播放效果。比如当年曾经卖得很火的使用YAMAHA YMF724/740做芯片的声音卡便带有X-MIDI的播放器S-YXG100

 

 

 

 

图表 - Roland Virtual SoundCanvas软音源界面

 

 

 

 

图表 - YAMAHA S-YXG50软音源播放器界面,怎么看都觉得比Roland的好看。

 

 

 

 

图表 - YAMAHA S-YXG50 XGPlayer软音源播放器界面,这个版本支持的播放控制更多。

 

 

  如果要对MIDI文件进行编辑,可以使用的比较出名的软件是Cake Walk ProSonarhttp://www.cakewalk.com);X-MIDI则要使用YAMAHA XGWorks。另外还有一些曲谱软件,比如Sibeliushttp://www.sibelius.com)。不过这些软件都是非常昂贵的。国产的相关软件都有一些,而且支持简谱,比如TT作曲家(http://www.centrmus.com)。

 

 

开放、免费 - Ogg Vorbis

 

 

  开放源代码的Ogg Vorbishttp://www.xiph.org http://www.vorbis.com),作为开放源码向专利技术下的第一封战书出现在世人的面前。在经历了一些变故之后,Ogg Vorbis终于在20027月释出了1.0版本。由于开放源码的东西向来都缺少枪手为其摇旗呐喊,所以国内并不是有很多的人了解Ogg VorbisOgg Vorbis 是一种音频压缩格式,类似于MP3等现有的通过有损压缩算法进行音频压缩的音乐格式。但有一点不同的是,Ogg Vorbis格式是完全免费、开放源码且没有专利限制的。Vorbis 是这种音频压缩机制的名字,而Ogg则是一个计划的名字,该计划意图设计一个完全开放源码的多媒体系统。开放源代码能为用户在经济上带来收益,这一点很多人都知道了,但不能忘记的是Ogg Vorbis的技术也不是盖的。Ogg Vorbis文件的扩展名是.OGG。这种文件的设计格式是非常灵活的。它的最大特点是在文件格式已经固定下来后还能对音质进行明显的调节和新算法。现在创建的OGG文件可以在未来的任何播放器上播放,因此,这种文件格式可以不断地进行大小和音质的改良,而不影响旧有的编码器或播放器。在压缩技术上,Ogg Vorbis的最主要特点是使用了VBR(可变比特率)和ABR(平均比特率)方式进行编码。与MP3CBR(固定比特率)相比可以达到更好的音质。Ogg Vorbis其他技术特性还包括:支持类似于MP3ID3信息,但比MP3要灵活而又完整得多,实际上可以填写随意多的信息。Vorbis还具有比特率缩放功能,可以不用重新编码便可调节文件的比特率。Vorbis文件可以被分成小块并以样本粒度(granularity,专业术语,指数据可以被分割的最小尺寸)进行编辑;Vorbis支持多通道(大于2)音频流并使用了独创性的处理技术;Vorbis文件可以以逻辑方式相连接等。

 

 

  在经济利益的推动下,Ogg Vorbis从一诞生就获得了各方的关注,许多著名音频软件,包括象出品Sound ForgeSonic Foundryhttp://www.sonicfoundry.com)这样的工业巨头也在软件中增加了对Ogg Vorbis的支持,而对于本来就是免费的或者开放源码的音频相关软件比如WinAMPhttp://www.winamp.com)、CDEXhttp://cdex.sourceforge.net)等等更是第一时间在软件中加入了Ogg Vorbis的支持。可以这样说,Ogg Vorbis在业界的支持是非常广泛的。简单的举个例子,著名的游戏闪点行动(Operation Flash Point)就是使用Ogg Vorbis作为游戏所有声音和音乐的保存格式的。

 

 

  当然,软件上的支持对于一种音乐格式来说还是一厢情愿的事情。Ogg Vorbis是否能够真正流行起来,关键还是要靠广大用户和音乐制作人。可喜的是,目前在网络上Ogg Vorbis格式的应用已经日渐增多,而且已经开始向其他方面发展,比如游戏、多媒体应用的配乐等。目前Ogg Vorbis取得的最大成就是获得著名的BBC广播公司的认可,使用Ogg Vorbis音频流在线播放节目。另外,在硬件方面也出现了支持播放OGG格式的播放器。

 

 

  Ogg Vorbis几乎得到所有的音频编辑器的支持。另外,作为一般的编码使用,可以在http://www.vorbis.com/download_win.psp网址可以下载到OggDrop/OggDrop XPd。播放可以使用WinAMP播放。现在Ogg Vorbis已经是WinAMP标准配置之一。

 

 

 

 

图表 - OggDrop XPd, Ogg Vorbis的编码器

 

 

生不逢时 VQF

 

 

  VQF实际指的是TwinVQTransform-domain Weighted INterleave Vector Quantization)技术,是日本Nippon Telegraph and Telephone集团属下的NTT Human Interface Laboratorieshttp://sound.splab.ecl.ntt.co.jp)开发的一种音频压缩技术。该技术受到著名的YAMAHA公司的支持。VQFTVQ是其文件的文件类型名。VQF其实是一种比较先进的技术,通常认为96kbps VQF 128kbps MP3 质量相同。下图是MP3VQF的一个质量对比示意图:

 

 

MP3 128Kbps

 

 

 

 

 

Original 1411Kpbs

 

 

 

 

 

VQF 96Kbps

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  虽然说质量相同,但由于VQF使用的是不同的技术,从这个图上大家应该可以感受到两者的差别。

 

 

  VQFYAMAHA公司的大力推动下也曾有相当的市场份额。不过时至今日,VQF已经在逐步淡出舞台。原因是多方面的。首先,VQF 是专门开发来用于低比特率情况的,对于录音室这种需要高保真的环境就无能为力了。换句话说,VQF仅适合一般播放用途。这使得VQF的应用范围相对狭窄。其次,VQF没有得到操作系统平台的直接支持,就像mp3PRO那样,Windows自始至终都不支持直接播放VQF文件,使得VQF得不到大范围的推广。再次,VQF是一种封闭的专利技术,导致市场所有与VQF相关的编码器、播放器无一不是YAMAHANTT的产物,这一点极大地妨碍了VQF的发展。最著名的一个例子就是一个曾经致力于推广VQF技术的网站:http://www.vqf.com宣布由于VQF的衰落而停止更新,等待高比特率(192kbps或以上)VQF格式出台后再作打算。虽然YAMAHA公司已经成功地将VQF提交到了MPEG组织,并成为MPEG-4标准的一部分,但这些努力也是无济于事的。因为MPEG-4本来就是一个面向对象的大包容的平台,与MPEG-1MPEG-2这样专门针对某种具体的技术而制定的标准已经不是一回事了。

 

 

  要播放VQF软件,可以通过给WinAMP增加支持插件来实现,也可以使用YAMAHA自己的SoundVQ Player播放器。编码软件可以使用YAMAHA SoundVQ Encoder或者NTT TwinVQ Encoder。后者的优化比较好,速度比前者快一些。

 

 

 

 

图表 - TwinVQ 编码器,非常简单的界面。

 

 

非主流

 

 

最热门的非主流 - MOD

 

 

  Module(简称mod)是数码音乐文件,由一组samples(乐器的声音采样)、曲谱和时序信息组成,告诉一个mod播放器何时以何种音高去演奏在某条音轨的某个样本,附带演奏一些效果比如颤音等。因而mod与纯正的象WAVAU那样的没有包含时序信息的样本文件不同,与象MIDI文件那样的不携带任何附加样本/乐器的文件也不同(与现在支持DLS技术的MIDI倒是有点相似,不过mod的体积要比DLS MIDI小得多。)。mod起源于Amiga计算机,当时的文件扩展名是MOD,为了区分具体的类型和整个结构体系,通常使用mod来表示整个Module格式体系。由于该格式起源很早,因此曾经非常流行,因为mod提供了一种具有可以接受的音质水平而又非常廉价的制作音乐的方法。而且这种文件的音质效果对于当时的电脑硬件水平来说效果比MIDI要好,文件的体积也不大,好处是轻而易见的。随着高质量的音响硬件的使用,新一代的mod的声音质量甚至可以提升到接近专业设备的水平。这使得mod成为一种介乎于象WAVVOC那样的纯正样本数据文件和象General MIDI那样的纯正时序信息文件之间的混合体,成为一种比较灵活的音频格式。

 

 

  但是,mod的最大缺点是具体的格式变化太多。由于原本的MOD格式只支持4条音轨,而且MOD格式并没有版权限制,导致后来涌现了一大堆在MOD的基础上改进而来的格式,比如xm这种支持高达32条音轨128种采样的格式。但由于mod格式的不统一,最终结果就是这种格式在商业领域没有多大的作为。Windows平台上曾经有一个非常好的播放器名为MOD4WIN,后来也停止了开发。目前支持播放Mod的播放器主要有WinAMP,比较新的制作软件则有Sk@le Trackerhttp://www.skale.org),是一个免费的软件。大家如果对这种格式产生兴趣的话可以到http://www.modplug.com 看看,这里是最齐全的关于mod的站点。

 

 

 

 

图表 - 非常华丽的Sk@le Tracker,目前还是0.75Beta版本

 

 

 

 

图表 - 同样有着不错界面的MOD4WIN的最后版本,也是免费软件。

 

 

一个也不能少 - Monkey's audio

 

 

  Monkey's Audiohttp://www.monkeysaudio.com)是一种无损压缩技术。他并不是由什么大公司发明的,完全是一个个人业余兴趣作品。为了使Monkey's Audio能有更好的发展,现在这个软件已经公开了源代码。

 

 

  这种压缩格式的特点是无损压缩,也就是说对压缩数据进行还原之后得到的数据与原来的数据是完全相同的。该格式的特点尤其适合那些拥有一对金耳朵并且一直对mp3的音质耿耿于怀的音乐发烧友。后者有人会问,要无损压缩,我随便找个压缩软件比如WINRAR都可以达到不错的效果了,还要这种格式干嘛?所以这里要澄清一个误解:使用普通的压缩软件进行压缩无疑是可以得到不错的压缩效果,有时候甚至更优于使用Monkey's Audio,但是压缩软件生成的压缩包必须要先解压还原之后才能播放里面的内容,而Monkey's Audio这种无损压缩编码得到的文件可以直接使用播放器(比如WinAMP)进行播放。Monkey's Audio的压缩效果大约在2:1左右,也就是说压缩结果是原来的二分之一大小。一张CD大约需要330MB左右的空间存放,相比之下还是比较占空间的。由于这个原因,所以对音质要求不是太高的人通常都选择VBR方式的mp3而不是选择它。

 

 

  与Monkey's Audio类似的编码格式还包括WavPackRKAUShorten等等。由于相对不是那么出名,又或者在某些方面不够Monkey's Audio做得好,因此获得的关注程度就逊色很多。

 

 

 

 

图表 - Monkey's Audio的压缩/解压器界面。那个猴子图案挺有趣的。

 

 

苹果专用 - aiff

 

 

  刚才我们在介绍WAV格式的时候已经提到过AIFF了。它是Apple苹果电脑(http://www.apple.com)上面的标准音频格式,属于QuickTime技术(http://www.apple.com/quicktime)的一部分。这一格式的特点就是格式本身与数据的意义无关,因此受到了Microsoft的青睐,并据此搞出来WAV格式。AIFF虽然是一种很优秀的文件格式,但由于它是苹果电脑上的格式,因此在PC平台上并没有得到很大的流行。不过由于Apple电脑多用于多媒体制作出版行业,因此几乎所有的音频编辑软件和播放软件都或多或少地支持AIFF格式。只要苹果电脑还在,AIFF就始终还占有一席之地。

 

 

  由于AIFF的包容特性,所以它支持许多压缩技术。这里顺带说说的是在苹果平台上原生的流媒体压缩技术是QDesign公司(http://www.qdesign.com)的QDMCQDesign Music Codec。据官方资料介绍,QDesign Music Codec 2能在全带宽立体声的设置下将音频压缩为原来的百分之一大小。与其他纯粹基于知觉音频编码技术(mp3等)不同的是,QDesign Music Codec 2 使用了新的专利的算法技术,因此,可以在modem的速度上达到相当的音频质量。该技术最大支持128kbps。不过在笔者的实验结果看来,该技术的唯一过人之处就是在任何比特率下都能提供44khz立体声的输出。不过脱离了音质的输出又有什么意思呢?

 

 

 

 

图表 - Quick Time 6 的播放器,正在播放aiff格式的文件。

 

 

聊胜于无 au

 

 

  au unix下一种常用的音频格式,起源于Sun 公司(http://www.sun.com)的Solaris系统。这种格式本身也支持多种压缩方式,但文件结构的灵活性就比不上aiffWAV。这种格式的最大问题是由于它本身所依附的平台不是面向广大消费者的,所以知道这东西的人并不多。但这种格式毕竟出现了很多年,所以许多播放器和音频编辑软件都提供了读/写支持。不过时至今日,在本人看来实在意义不大,因为这个文件格式对目前许多新出现的音频技术都无法提供支持,起不到类似于WAVaiff那种通用性音频存储平台的作用。目前可能唯一必须使用au格式来保存音频文件的就是java平台。

 

 

曾经辉煌 VOC

 

 

  当年创新公司(Creative, http://www.creative.com)的声音卡成了PC平台上的多媒体声音卡事实标准的时候,VOC格式也跟同着成为了DOS系统下面的音频文件格式标准。因为它是创新公司发明的音频文件格式。当然,现在已经很少见到了。由于该格式属于硬件公司的产品,因此不可避免地带有浓厚的硬件相关色彩。这一点随着Windows平台本身提供了标准的文件格式WAV之后就变成了明显的缺点。加上Windows平台不提供对VOC格式的直接支持,所以VOC格式很快便消失在人们的视线中。不过现在的很多播放器和音频编辑器都还是支持该格式的,道理就跟au一样:出来的早嘛!

 

 

记住你的声音 - vox

 

 

  这个格式比较特殊。Vox引申是voice的意思,表明了该格式专门面向语音音频。它是由Dialogic公司(现已被Intel公司收购)发明的,使用ADPCM压缩技术进行压缩,主要应用于语音通信方面。由于面向语音压缩,因此该技术专门针对低采样律进行优化。该格式仅支持单声道16位音频,并达到了4:1的压缩比(它将每个音频有损压缩为4个比特)。该格式最大的失败在于没有文件头,无法在音频文件中储存相关的信息。如果你忘记了当初是以什么采样频率录的音,那就是一场恶梦。这个文件格式最常见于一些利用互联网进行语音通信的软件,比如PC2Phone。主流音频编辑器一般都支持这个格式。

 

 

  在介绍了这么多音频媒体格式之后,我们来看看下面的特点概括列表:

 

 

媒体格式

 

 

扩展名

 

 

相关公司或组织

 

 

主要优点

 

 

主要缺点

 

 

适用领域

 

 

WAV

 

 

wav

 

 

Microsoft

 

 

可通过增加驱动程序而支持各种各样的编码技术。

 

 

不适于传播和用作聆听。支持的编码技术大部分只能在Windows平台下使用。

 

 

音频原始素材保存。

 

 

mp3(MPEG 音频)

 

 

mp3

 

 

(包括mp2

 

 

mp1

 

 

mpa等)

 

 

Fraunhofer-IIS

 

 

在低至128kbps的比特率下提供接近CD音质的音频质量。广泛的支持。

 

 

出现得比较早,因此音质不是很好。

 

 

一般聆听和高保真聆听。

 

 

mp3PRO

 

 

mp3

 

 

Fraunhofer-IIS

 

 

CodingTechnologies

 

 

Thomson Multimedia

 

 

在低至64kbps的比特率下提供接近CD音质的音频质量。

 

 

专利费用较高,支持的软件和硬件不多。

 

 

一般聆听和高保真聆听。

 

 

RealMedia

 

 

ra, rma

 

 

RealNetworks

 

 

在极低的比特率环境下提供可听的音频质量。

 

 

不适于除网络传播之外的用途。音质不是很好。

 

 

网络音频流传输。

 

 

Windows Media

 

 

wma, asf

 

 

Microsoft

 

 

功能齐全,使用方便。同时支持无失真、有失真、语音压缩方式。

 

 

失真压缩方式下音质不高。必须在Windows平台下才能使用。

 

 

音频档案级别保存,一般聆听,网络音频流传输。

 

 

MIDI

 

 

MID

 

 

MIDI

 

 

RMI

 

 

XMI

 

 

 

 

MIDI Association

 

 

音频数据为乐器的演奏控制,通常不带有音频采样。

 

 

没有波表硬件或软件配合时播放效果不佳。

 

 

与电子乐器的数据交互,乐曲创作等。

 

 

Ogg Vorbis

 

 

OGG

 

 

Xiph Foundation

 

 

在低至64kbps的比特率下提供接近CD音质的音频质量。开放源代码,不需要支付使用许可费用。跨平台。

 

 

发展较慢。推广力度不足。

 

 

一般聆听和高保真聆听。

 

 

VQF

 

 

vqf

 

 

tvq

 

 

NTT Human Interface Laboratories

 

 

在低至96kbps的比特率下提供接近CD音质的音频质量。

 

 

相关软件太少。

 

 

一般聆听。

 

 

MOD(Module)

 

 

mod s3m it xm mtm ult 669

 

 

Amigamod社区

 

 

音频数据由乐器采样和乐谱、演奏控制信息组成。

 

 

具体的文件格式太多影响推广和使用。

 

 

一般聆听。

 

 

Monkey's Audio

 

 

ape

 

 

Matthew T. Ashland

 

 

无失真压缩。部分开放代码。

 

 

由于是个人作品,使用上存在一定风险。

 

 

高保真聆听和音频档案级别保存。

 

 

aiff

 

 

aiff

 

 

Apple

 

 

可通过增加驱动程序而支持各种各样的编码技术

 

 

一般限于苹果电脑平台使用。

 

 

苹果电脑平台下音频原始素材保存。

 

 

au

 

 

au

 

 

Sun

 

 

UnixJava平台下的标准文件格式。

 

 

支持的压缩技术太少且音频数据格式受文件格式本身局限。

 

 

UnixJava平台下音频原始素材保存。

 

 

voc

 

 

voc

 

 

Creative

 

 

对于目前的音频技术来讲,该格式已经没有什么优点了。

 

 

与具体的硬件相结合因此没有延续性。

 

 

淘汰。

 

 

vox

 

 

vox

 

 

Dialogic

 

 

面向语音的编码。

 

 

文件格式缺乏足够的信息,因此不适应作存档用途。技术比较早期。

 

 

淘汰。

 

 

  当然,无论一种音频格式目前是否主流,在未来都有可能被新出现的更先进的技术取代。不过从目前的形势来看,音频技术已经发展到了一个成熟的、优胜劣汰的阶段。那些没有技术优势的音频格式将很快就会被市场淘汰掉,而存活下来的音频技术由于技术性能方面已经非常接近且基本上不存在继续发展的空间,将会努力从网络功能和应用功能两方面去吸引用户并打倒竞争对手。因此,实力强大的商业公司在这方面有着充分的优势。可喜的是由于开放源代码运动的发展,我们在商业技术之外还可以有另外一个选择。所以,音频技术的发展可以肯定的是只会剩下一个商业公司的技术和一个开放源码的技术并存。就像现在的操作系统之争那样。

 

 

  作为一个音频技术的用户,如何选择适合自己的音频格式是一个比较头疼的事情。有些人趋向音质要求高;有些则需要丰富的附加功能。要做出自己的选择,则必须首先搞清楚自己需要的是什么。另外,需要提醒大家的是,随着中国电子政务的铺开以及Linux在电子政务中的应用,我们必须重视开放源代码这一不可忽视的要素,否则由于选择错了音频格式而导致随后工作的推倒重来那可是严重的经济损失。

 

 

  希望大家看完这篇文章后能对目前繁多的各种音频格式有一个大致的了解,并能正确地作出适合自己的选择。

 

 

- END -

 

 

四、视频文件格式介绍

 

 

 

 

 


目前有多种视频压缩编码方法,下面就目前比较流行的一些视频格式作一介绍。
*.AVI   

 

 

    AVI文件格式想来大家不会陌生了,AVI是音频视频交错(Audio Video Interleaved)的英文缩写。AVI这个由老大微软公司从 WIN3.1 时代就开始发表的旧视频格式已经为大家兢兢业业地服务了好几个年头了。如果这个都不认识,哥们你还是别往下看了^_^,这个东西的好处嘛,无非是兼容好、调用方便、图象质量好,但缺点也是比较突出的,那就是文件体积过于庞大,也正是由于这个原因,我们才能够陆续看到由 MPEG1 的诞生到现在 MPEG4 的出台。

 

 

*.MPEG/.MPG/.DAT

 

 

    MPEG也是Motion Picture Experts Group 的缩写。这个家族中包括了 MPEG-1, MPEG-2 MPEG-4在内的多种视频格式 (值得指出的是,大家在这里没有见到MPEG-3的字样,因为大家熟悉的MP3 只是 MPEG Layeur 3)。MPEG-1相信是大家接触得最多的了,因为目前其正在被广泛地应用在 VCD 的制作和一些视频片段下载的网络应用上面,可以说 99% VCD 都是用 MPEG1 格式压缩的,(注意 VCD2.0 并不是说明 VCD 是用 MPEG-2 压缩的)使用 MPEG-1 的压缩算法,可以把一部 120 分钟长的电影(未视频文件)压缩到 1.2 GB 左右大小。MPEG-2 则是应用在 DVD 的制作(压缩)方面,同时在一些 HDTV(高清晰电视广播)和一些高要求视频编辑、处理上面也有相当的应用面。使用 MPEG-2 的压缩算法压缩一部 120 分钟长的电影(未视频文件)可以到压缩到 4 8 GB 的大小(当然,其图象质量等性能方面的指标 MPEG-1 是没得比的)。
  这里值得多说两句的是DIVXMPEG4DIVX 视频编码技术可以说是一种对 DVD 造成威胁的新生视频压缩格式,也有人说它是 DVD 杀手,它由 Microsoft mpeg4 v3 修改而来,使用了MPEG4的压缩算法。同时它也可以说是为了打破 ASF 的种种协定而发展出来的。而使用这种据说是美国禁止出口的编码技术MPEG4 压缩一部 DVD 只需要 2 CDROM。这样就意味着读者不需要额外购买DVD光驱也可以得到和它差不多的视频质量。而且播放这种编码,对机器的要求也不高,CPU的最低额度只要求在300MHZ 以上,而且在CPU类型的选择方面,不论你的芯是PIICELERON还是PIIIAMDK6/2AMDK6IIIATHALON,就是CYRIXx86也可以统吃拿下。在配置上64 兆内存和一个 8兆显存的显卡上,DIVX便可以流畅的播放了。

 

 

*.RA/RM

 

 

    "*.RM"文件恐怕现在不少用户已经不再陌生,而且随着网络技术的蓬勃发展,这种新型的流式视频文件格式已经很有替代传统视频格式的气势,而它不过是RealNetworks公司所制定的音频/视频压缩规范RealMedia中的一种,RealPlayer能做的就是利用Internet资源对这些符合RealMedia技术规范的音频/视频进行实况转播。RealMedia是目前Internet上最流行的跨平台的客户/服务器结构多媒体应用标准,其采用音频/视频流和同步回放技术实现了网上全带宽的多媒体回放。在RealMedia规范中主要包括三类文件:RealAudio(用以传输接近CD音质的音频数据)、RealVideo(用来传输连续视频数据)和RealFlash RealNetworks公司与Macromedia公司合作推出的新一代高压缩比动画格式)。而RealPlayer就是在网上收听收看这些实时音频、视频和Flash的最佳工具。只要用户的线路允许,使用RealPlayer可以不必下载音频/视频内容就能实现网络在线播放,更容易地上网查找和收听、收看各种广播、电视,而且最新的REALPLAY版本中还新增了AOL Internet Messenger RealJukebox两项管理功能,使该软件的整体表现更为完善。REAL VIDEO RARAM)格式由一开始就是定位就是在视频流应用方面的,也可以说是视频流技术的始创者。它可以在用 56K MODEM 拨号上网的条件实现不间断的视频播放,当然,其图象质量和 MPEG2DIVX 等比是不敢恭维的啦。

 

 

*.MOV/.QT

 

 

    玩电脑的朋友恐怕少有不知QuickTime大名的。QuickTime属于个人电脑上的舶来之物,原本是Apple公司用于其Mac计算机的一种图像及视频处理软件。Mac在图像和视频处理领域的地位尽人皆知,在PC机还在黑白DOS时代苦苦摸索之际,Mac机就已经"WINDOWS"大开了。作为处理图像及数字视频的系统结构,Quick-Time提供了两种标准图像和数字视频格式,即可以支持静态的*.PIC*.JPG图像格式,动态的基于Indeo压缩法的*.MOV和基于MPEG压缩法的*.MPG视频格式。到目前为止,它共有 4 个版本,其中以 4.0 版本的压缩率最好。随着个人多媒体电脑的近几年的飞速普及,Apple公司不失时机地推出了QuickTimeWindows版本,也就是我们今天见到的QuickTime for Windows。该软件是由MAC上的内核视频播放器(QuickTimeMovie,可支持MOVMPG两种视频文件格式)和图像播放器(图像浏览器,只支持PICJPEG两种格式的图片)两部分组成,利用QuickTime提供的延伸功能,允许第三方应用程序通过系统借助QuickTime作为技术底层,发挥强大的多媒体交互处理功能,目前国外很多电脑游戏中都内置了QuickTime作为唯一的播放器。在这些第三方程序中包括了著名的图像处理专家Adobe公司的专业级多媒体视频处理软件AfterEffectPremiere

 

 

*.ASF

 

 

    ASF Advanced Streaming format 的缩写,由字面(高级流格式)意思就应该看出这个格式的用处了吧。说穿了 ASF 就是 MICROSOFT 为了和现在的 Real player 竞争而发展出来的一种可以直接在网上观看视频节目的文件压缩格式!由于它使用了 MPEG4 的压缩算法,所以压缩率和图像的质量都很不错。因为 ASF 是以一个可以在网上即时观赏的视频""格式存在的,所以它的图象质量比 VCD 差一点点并不出奇,但比同是视频""格式的 RAM 格式要好。不过如果你不考虑在网上传播,选最好的质量来压缩文件的话,其生成的视频文件比 VCD MPEG1)好是一点也不奇怪的,但这样的话,就失去了 ASF 本来的发展初衷,还不如干脆用 N AVI 或者 DIVX 。但微软的"子第"就是有它特有的优势,最明显的是各类软件对它的支持方面就无人能敌。

 

 

*.WMV

 

 

    又是一种独立于编码方式的在Internet上实时传播多媒体的技术标准,Microsoft公司希望用其取代QuickTime之类的技术标准以及WAVAVI之类的文件扩展名。wmv的主要优点包括:本地或网络回放、可扩充的媒体类型、部件下载、可伸缩的媒体类型、流的优先级化、多语言支持、环境独立性、丰富的流间关系以及扩展性等。

 

 

*.AVI(n AVI)

 

 

    如果你发现原来的播放器突然打不开这种格式的avi文件了,那你就要考虑是不是碰到了n AVIn AVI newAVI 的缩写,是一个名为 ShadowRealm 的地下组织发展起来的一种新视频格式。它是由 Microsoft ASF 压缩算法的修改而来的(并不是想象中的 AVI),视频格式追求的无非是压缩率和图象质量,所以 NAVI 为了追求这个目标,改善了原始的 ASF 格式的一些不足,让 NAVI 可以拥有更高的帧率(frame rate)。当然,这是牺牲 ASF 的视频流特性作为代价的。概括来说, NAVI 就是一种去掉视频流特性的改良型 ASF 格式,也可以被视为是非网络版本的 ASF

 

 

 

 

 

 

五、图形文件格式大全  

一、BMP格式

 

 

BMP是英文Bitmap(位图)的简写,它是Windows操作系统中的标准图像文件格式,能够被多种Windows应用程序所支持。随着Windows操作系统的流行与丰富的Windows应用程序的开发,BMP位图格式理所当然地被广泛应用。这种格式的特点是包含的图像信息较丰富,几乎不进行压缩,但由此导致了它与生俱生来的缺点--占用磁盘空间过大。所以,目前BMP在单机上比较流行。

 

 

二、GIF格式

 

 

GIF是英文Graphics Interchange Format(图形交换格式)的缩写。顾名思义,这种格式是用来交换图片的。事实上也是如此,上世纪80年代,美国一家著名的在线信息服务机构CompuServe针对当时网络传输带宽的限制,开发出了这种GIF图像格式。

 

 

GIF格式的特点是压缩比高,磁盘空间占用较少,所以这种图像格式迅速得到了广泛的应用。 最初的GIF只是简单地用来存储单幅静止图像(称为GIF87a),后来随着技术发展,可以同时存储若干幅静止图象进而形成连续的动画,使之成为当时支持2D动画为数不多的格式之一(称为GIF89a),而在GIF89a图像中可指定透明区域,使图像具有非同一般的显示效果,这更使GIF风光十足。目前Internet上大量采用的彩色动画文件多为这种格式的文件,也称为GIF89a格式文件。

 

 

此外,考虑到网络传输中的实际情况,GIF图像格式还增加了渐显方式,也就是说,在图像传输过程中,用户可以先看到图像的大致轮廓,然后随着传输过程的继续而逐步看清图像中的细节部分,从而适应了用户的"从朦胧到清楚"的观赏心理。目前Internet上大量采用的彩色动画文件多为这种格式的文件。

 

 

GIF有个小小的缺点,即不能存储超过256色的图像。尽管如此,这种格式仍在网络上大行其道应用,这和GIF图像文件短小、下载速度快、可用许多具有同样大小的图像文件组成动画等优势是分不开的。

 

 

三、JPEG格式

 

 

JPEG也是常见的一种图像格式,它由联合照片专家组(Joint Photographic Experts Group)开发并以命名为"ISO 10918-1"JPEG仅仅是一种俗称而已。JPEG文件的扩展名为.jpg.jpeg,其压缩技术十分先进,它用有损压缩方式去除冗余的图像和彩色数据,获取得极高的压缩率的同时能展现十分丰富生动的图像,换句话说,就是可以用最少的磁盘空间得到较好的图像质量。

 

 

同时JPEG还是一种很灵活的格式,具有调节图像质量的功能,允许你用不同的压缩比例对这种文件压缩,比如我们最高可以把1.37MBBMP位图文件压缩至20.3KB。当然我们完全可以在图像质量和文件尺寸之间找到平衡点。

 

 

由于JPEG优异的品质和杰出的表现,它的应用也非常广泛,特别是在网络和光盘读物上,肯定都能找到它的影子。目前各类浏览器均支持JPEG这种图像格式,因为JPEG格式的文件尺寸较小,下载速度快,使得Web页有可能以较短的下载时间提供大量美观的图像,JPEG同时也就顺理成章地成为网络上最受欢迎的图像格式。

 

 

四、JPEG2000格式

 

 

JPEG 2000同样是由JPEG 组织负责制定的,它有一个正式名称叫做"ISO 15444",与JPEG相比,它具备更高压缩率以及更多新功能的新一代静态影像压缩技术。

 

 

JPEG2000 作为JPEG的升级版,其压缩率比JPEG高约30%左右。与JPEG不同的是,JPEG2000 同时支持有损和无损压缩,而 JPEG 只能支持有损压缩。无损压缩对保存一些重要图片是十分有用的。JPEG2000的一个极其重要的特征在于它能实现渐进传输,这一点与GIF"渐显"有异曲同工之妙,即先传输图像的轮廓,然后逐步传输数据,不断提高图像质量,让图象由朦胧到清晰显示,而不必是像现在的 JPEG 一样,由上到下慢慢显示。

 

 

此外,JPEG2000还支持所谓的"感兴趣区域"特性,你可以任意指定影像上你感兴趣区域的压缩质量,还可以选择指定的部份先解压缩。 JPEG 2000 JPEG 相比优势明显,且向下兼容,因此取代传统的JPEG格式指日可待。

 

 

JPEG2000可应用于传统的JPEG市场,如扫描仪、数码相机等,亦可应用于新兴领域,如网路传输、无线通讯等等。

 

 

五、TIFF格式

 

 

TIFFTag Image File Format)是Mac中广泛使用的图像格式,它由Aldus和微软联合开发,最初是出于跨平台存储扫描图像的需要而设计的。它的特点是图像格式复杂、存贮信息多。正因为它存储的图像细微层次的信息非常多,图像的质量也得以提高,故而非常有利于原稿的复制。

 

 

该格式有压缩和非压缩二种形式,其中压缩可采用LZW无损压缩方案存储。不过,由于TIFF格式结构较为复杂,兼容性较差,因此有时你的软件可能不能正确识别TIFF文件(现在绝大部分软件都已解决了这个问题)。目前在MacPC机上移植TIFF文件也十分便捷,因而TIFF现在也是微机上使用最广泛的图像文件格式之一。

 

 

六、PSD格式

 

 

这是著名的Adobe公司的图像处理软件Photoshop的专用格式Photoshop DocumentPSD)。PSD其实是Photoshop进行平面设计的一张"草稿图",它里面包含有各种图层、通道、遮罩等多种设计的样稿,以便于下次打开文件时可以修改上一次的设计。在Photoshop所支持的各种图像格式中,PSD的存取速度比其它格式快很多,功能也很强大。由于Photoshop越来越被广泛地应用,所以我们有理由相信,这种格式也会逐步流行起来。

 

 

七、PNG格式

 

 

PNGPortable Network Graphics)是一种新兴的网络图像格式。在1994年底,由于Unysis公司宣布GIF拥有专利的压缩方法,要求开发GIF软件的作者须缴交一定费用,由此促使免费的png图像格式的诞生。PNG一开始便结合GIFJPG两家之长,打算一举取代这两种格式。1996101PNG向国际网络联盟提出并得到推荐认可标准,并且大部分绘图软件和浏览器开始支持PNG图像浏览,从此PNG图像格式生机焕发。

 

 

PNG是目前保证最不失真的格式,它汲取了GIFJPG二者的优点,存贮形式丰富,兼有GIFJPG的色彩模式;它的另一个特点能把图像文件压缩到极限以利于网络传输,但又能保留所有与图像品质有关的信息,因为PNG是采用无损压缩方式来减少文件的大小,这一点与牺牲图像品质以换取高压缩率的JPG有所不同;它的第三个特点是显示速度很快,只需下载1/64的图像信息就可以显示出低分辨率的预览图像;第四,PNG同样支持透明图像的制作,透明图像在制作网页图像的时候很有用,我们可以把图象背景设为透明,用网页本身的颜色信息来代替设为透明的色彩,这样可让图像和网页背景很和谐地融合在一起。

 

 

PNG的缺点是不支持动画应用效果,如果在这方面能有所加强,简直就可以完全替代GIFJPEG了。Macromedia公司的Fireworks软件的默认格式就是PNG。现在,越来越多的软件开始支持这一格式,而且在网络上也越来截止流行。

 

 

八、SWF格式

 

 

利用Flash我们可以制作出一种后缀名为SWFShockwave Format)的动画,这种格式的动画图像能够用比较小的体积来表现丰富的多媒体形式。在图像的传输方面,不必等到文件全部下载才能观看,而是可以边下载边看,因此特别适合网络传输,特别是在传输速率不佳的情况下,也能取得较好的效果。事实也证明了这一点,SWF如今已被大量应用于WEB网页进行多媒体演示与交互性设计。此外,SWF动画是其于矢量技术制作的,因此不管将画面放大多少倍,画面不会因此而有任何损害。综上,SWF格式作品以其高清晰度的画质和小巧的体积,受到了越来越多网页设计者的青睐,也越来越成为网页动画和网页图片设计制作的主流,目前已成为网上动画的事实标准。

 

 

九、SVG格式

 

 

SVG可以算是目前最最火热的图像文件格式了,它的英文全称为Scalable Vector Graphics,意思为可缩放的矢量图形。它是基于XMLExtensible Markup Language),由World Wide Web ConsortiumW3C)联盟进行开发的。严格来说应该是一种开放标准的矢量图形语言,可让你设计激动人心的、高分辨率的Web图形页面。用户可以直接用代码来描绘图像,可以用任何文字处理工具打开SVG图像,通过改变部分代码来使图像具有互交功能,并可以随时插入到HTML中通过浏览器来观看。

 

 

它提供了目前网络流行格式GIFJPEG无法具备了优势:可以任意放大图形显示,但绝不会以牺牲图像质量为代价;字在SVG图像中保留可编辑和可搜寻的状态;平均来讲,SVG文件比JPEGGIF格式的文件要小很多,因而下载也很快。可以相信,SVG的开发将会为Web提供新的图像标准。

 

 

其它非主流图像格式:

 

 

1PCX格式

 

 

PCX格式是ZSOFT公司在开发图像处理软件Paintbrush时开发的一种格式,这是一种经过压缩的格式,占用磁盘空间较少。由于该格式出现的时间较长,并且具有压缩及全彩色的能力,所以现在仍比较流行。

 

 

2DXF格式

 

 

DXFAutodesk Drawing Exchange Format)是AutoCAD中的矢量文件格式,它以ASCII码方式存储文件,在表现图形的大小方面十分精确。许多软件都支持DXF格式的输入与输出。

 

 

3WMF格式

 

 

WMFWindows Metafile Format)是Windows中常见的一种图元文件格式,属于矢量文件格式。它具有文件短小、图案造型化的特点,整个图形常由各个独立的组成部分拼接而成,其图形往往较粗糙。

 

 

4EMF格式

 

 

EMFEnhanced Metafile)是微软公司为了弥补使用WMF的不足而开发的一种Windows 32位扩展图元文件格式,也属于矢量文件格式,其目的是欲使图元文件更加容易接受

 

 

5LICFLI/FLC)格式

 

 

Flic格式由Autodesk公司研制而成,FLICFLCFLI的统称:FLI是最初的基于320×200分辨率的动画文件格式,而FLC则采用了更高效的数据压缩技术,所以具有比FLI更高的压缩比,其分辨率也有了不少提高。

 

 

6EPS格式

 

 

EPSEncapsulated PostScript)是PC机用户较少见的一种格式,而苹果Mac机的用户则用得较多。它是用PostScript语言描述的一种ASCII码文件格式,主要用于排版、打印等输出工作。

 

 

7TGA格式

 

 

TGATagged Graphics)文件是由美国Truevision公司为其显示卡开发的一种图像文件格式,已被国际上的图形、图像工业所接受。TGA的结构比较简单,属于一种图形、图像数据的通用格式,在多媒体领域有着很大影响,是计算机生成图像向电视转换的一种首选格式。

 

 



评论 / 个人网页 / 扔小纸条
*昵称

已经注册过? 请登录

Email
网址
*评论