概述编辑本段回目录
![]() |
视频光盘 |
格式编辑本段回目录
(1)音频处理技术
影音文件涉及到多方面的音频处理技术,如:音频采集、语音编码/解码、文一-语转换、音乐合成、语音识别与理解、音频数据传输、音频一-视频同步、音频效果与编辑等。其中数字音频是个关键的概念,它指的是一个用来表示声音强弱的数据序列,它是由模拟声音经抽样(即每隔一个时间间隔在模拟声音波形上取一个幅度值)量化和编码(即把声音数据写成计算机的数据格式)后得到的。计算机数字CD、数字磁带(DAT)中存储的都是数字声音。模拟一-数字转换器把模拟声音变成数字声音;数字一-模拟转换器可以恢复出模拟来的声音。
一般来讲,实现计算机语音输出有两种方法:一是录音/重放,二是文一-语转换。第二种方法是基于声音合成技术的一种声音产生技术,它可用于语音合成和音乐合成。而第一种方法是最简单的音乐合成方法,曾相继产生了应用调频(FM)音乐合成技术和波形表(wavetable)音乐合成技术。
(2)乐器数字接口MIDI的概念
现在我们用的最多的音频名词之一MIDI(musical instrument digital interface)是作为“乐器数字接口”的缩写出现的,并用它来泛指数字音乐的国际标准。由于它定义了计算机音乐程序、合成器及其他电子设备交换信息和电子信号的方式,所以可以解决不同电子乐器之间不兼容的问题。另外,标准的多媒体PC平台能够通过内部合成器或连接到计算机MIDI端口的外部合成器播放MIDI文件,利用MIDI文件演奏音乐,所需的存储量最少。
至于MIDI文件,是指存放MIDI信息的标准文件格式。MIDI文件中包含音符、定时和多达16个通道的演奏定义。文件包括每个通道的演奏音符信息:键通道号、音长、音量和力度(击键时,键达到最低位置的速度)。由于MDDI文件是一系列指令,而不是波形,它需要的磁盘空间非常少;并且现装载MIDI文件比波形文件容易的多。这样,在设计影音文件节目时,我们可以指定什么时候播放音乐,将有很大的灵活性。在以下几种情况下,使用MIDI文件比使用波形音频更合适:需要播放长时间高质量音乐,如想在硬盘上存储的音乐大于4分钟,而硬盘又没有足够的存储容量;需要以音乐作背景音响效果,同时从CD-ROM中装载其它数据,如图像、文字的显示;需要以音乐作背景音响效果,同时播放波形音频或实现文一语转换,以实现音乐和语音的同时输出。
(3)常见的声音文件格式
再接下来我们介绍七种目前最为流行的声音文件:
★ WAVE,扩展名为WAV:该格式记录声音的波形,故只要采样率高、采样字节长、机器速度快,利用该格式记录的声音文件能够和原声基本一致,质量非常高,但这样做的代价就是文件太大。
★ MOD,扩展名MOD、ST3、XT、S3M、FAR、669等:该格式的文件里存放乐谱和乐曲使用的各种音色样本,具有回放效果明确,音色种类无限等优点。但它也有一些致命弱点,以至于现在已经逐渐淘汰,目前只有MOD迷及一些游戏程序中尚在使用。
★MPEG1-layer3,扩展名MP3:现在最流行的声音文件格式,因其压缩率大,在网络可视电话通信方面应用广泛,但和CD唱片相比,音质不能令人非常满意。
★ Real Audio,扩展名RA:这种格式真可谓是网络的灵魂,强大的压缩量和极小的失真使其在众多格式中脱颖而出。和MP3相同,它也是为了解决网络传输带宽资源而设计的,因此主要目标是压缩比和容错性,其次才是音质。
★ Creative Musical Format,扩展名CMF:Creative公司的专用音乐格式,和MIDI差不多,只是音色、效果上有些特色,专用于FM声卡,但其兼容性也很差。
★ CD Audio音乐CD,扩展名CDA:唱片采用的格式,又叫“红皮书”格式,记录的是波形流,绝对的纯正、HIFI。但缺点是无法编辑,文件长度太大。
★ MIDI,扩展名MID:目前最成熟的音乐格式,实际上已经成为一种产业标准,其科学性、兼容性、复杂程度等各方面当然远远超过本文前面介绍的所有标准(除交响乐CD、Unplug CD外,其它CD往往都是利用MIDI制作出来的),它的General MIDI就是最常见的通行标准。作为音乐工业的数据通信标准,MIDI能指挥各音乐设备的运转,而且具有统一的标准格式,能够模仿原始乐器的各种演奏技巧甚至无法演奏的效果,而且文件的长度非常小。
总之,如果有专业的音源设备,那么要听同一首曲子的HIFI程度依次是:
原声乐器演奏 〉 MIDI 〉 CD唱片 〉 MOD 〉 所谓声卡上的MIDI 〉 CMF,而MP3及RA要看它的节目源是采用MIDI、CD还是MOD了。
另外,存储声音信息的文件格式也是需要认识的,共有:
WAV文件、VOC文件、MIDI文件、RMI文件、PCM文件以及AIF文件等若干种。
★ WAV文件:Microsoft公司的音频文件格式,它来源于对声音模拟波形的采样。用不同的采样频率对声音的模拟波形进行采样可以得到一系列离散的采样点,以不同的量化位数(8位或16位)把这些采样点的值转换成二进制数,然后存入磁盘,这就产生了声音的WAV文件,即波形文件。Microsoft Sound System软件Sound Finder可以转换AIF SND和VOD文件到WAV格式。
★ VOC文件:Creative公司波形音频文件格式,也是声霸卡(sound blaster)使用的音频文件格式。每个VOC文件由文件头块(header block)和音频数据块(data block)组成。文件头包含一个标识版本号和一个指向数据块起始的指针。数据块分成各种类型的子块。如声音数据静音标识ASCII码文件重复的结果重复以及终止标志,扩展块等。
★ MIDI文件:Musical Instrument Digital Interface(乐器数字接口)的缩写。它是由世界上主要电子乐器制造厂商建立起来的一个通信标准,以规定计算机音乐程序 电子合成器和其它电子设备之间交换信息与控制信号的方法。MIDI文件中包含音符定时和多达16个通道的乐器定义,每个音符包括键通道号持续时间音量和力度等信息。所以MIDI文件记录的不是乐曲本身,而是一些描述乐曲演奏过程中的指令。
★ RMI文件:Microsoft公司的MIDI文件格式,它可以包括图片标记和文本。
★ PCM文件:模拟音频信号经模数转换(A/D变换)直接形成的二进制序列,该文件没有附加的文件头和文件结束标志。在声霸卡提供的软件中,可以利用VOC-HDR程序,为PCM格式的音频文件加上文件头,而形成VOC格式。Windows的Convert工具可以把PCM音频格式的文件转换成Microsoft的WAV格式的文件。
★ AIF文件:Apple计算机的音频文件格式。Windows的Convert工具同样可以把AIF格式的文件换成Microsoft的WAV格式的文件。
(1)编码方式
视频文件的编码方式制定者主要有国际化标注组织(ISO)和国际电报联盟电信标准化部门(ITU-T)。
MPEG的全名为[Moving Pictures Experts Group],中文译名是动态图像专家组。
MPEG的缔造者们原先打算开发四个版本:MPEG1-MPEG4,以适用于不同带宽和数字影像质量的要求。后由于MPEG3被放弃,所以现存只有三个版本的MPEG:MPEG-1,MPEG-2,MPEG-4。总体来说,MPEG在三方面优于其他压缩/解压缩方案。首先,由于在一开始它就是做为一个国际化的标准来研究制定,所以,MPEG具有很好的兼容性。其次,MPEG能够比其他算法提供更好的压缩比,最高可达200:1。更重要的是,MPEG在提供高压缩比的同时,对数据的损失很小。
★MPEG-1制定于1992年,为工业级标准而设计,可适用于不同带宽的设备,如CD-ROM、Video-CD、CD-i。它可针对SIF标准分辨率(对于NTSC制为352X240;对于PAL制为352X288)的图象进行压缩,传输速率为1.5Mbits/sec,每秒播放30帧,具有CD(指激光唱盘)音质,质量级别基本与VHS相当。MPEG的编码速率最高可达4-5Mbits/sec,但随着速率的提高,其解码后的图象质量有所降低。
MPEG-1也被用于数字电话网络上的视频传输,如非对称数字用户线路(ADSL),视频点播(VOD),以及教育网络等。同时,MPEG-1也可被用做记录媒体或是在INTERNET上传输音频。
★MPEG-2制定于1994年,设计目标是高级工业标准的图象质量以及更高的传输率。MPEG-2所能提供的传输率在3-10Mbits/sec间,其在NTSC制式下的分辨率可达720X486,MPEG-2也可提供并能够提供广播级的视像和CD级的音质。MPEG-2的音频编码可提供左右中及两个环绕声道,以及一个加重低音声道,和多达7个伴音声道(DVD可有8种语言配音的原因)。由于MPEG-2在设计时的巧妙处理,使得大多数MPEG-2解码器也可播放MPEG-1格式的数据,如VCD。
同时,由于MPEG-2的出色性能表现,已能适用于HDTV,使得原打算为HDTV设计的MPEG-3,还没出世就被抛弃了。(MPEG-3要求传输速率在20Mbits/sev-40Mbits/sec间,但这将使画面有轻度扭曲)。除了做为DVD的指定标准外,MPEG-2还可用于为广播,有线电视网,电缆网络以及卫星直播(DirectBroadcastSatellite)提供广播级的数字视频。
MPEG-2的另一特点是,其可提供一个较广的范围改变压缩比,以适应不同画面质量,存储容量,以及带宽的要求。
对于最终用户来说,由于现存电视机分辨率限制,MPEG-2所带来的高清晰度画面质量(如DVD画面)在电视上效果并不明显,到是其音频特性(如加重低音,多伴音声道等)更引人注目。
★ MPEG专家组的专家们正在为MPEG-4的制定努力工作。MPEG-4标准主要应用于视像电话(videophone),视像电子邮件(VideoEmail)和电子新闻(Electronicnews)等,其传输速率要求较低,在4800-64000bits/sec之间,分辨率176X144。
MPEG-4利用很窄的带宽,通过帧重建技术,压缩和传输数据,以求以最少的数据获得最佳的图象质量。
与MPEG-1和MPEG-2相比,MPEG-4的特点是其更适于交互AV服务以及远程监控。MPEG-4是第一个使你由被动变为主动(不再只是观看,允许你加入其中,即有交互性)的动态图象标准;它的另一个特点是其综合性;从根源上说,MPEG-4试图将自然物体与人造物体相溶合(视觉效果意义上的)。MPEG-4的设计目标还有更广的适应性和可扩展性。
MPEG问世数年来,给计算机和家电产业带来的冲击是巨大的。各种基于MPEG标准的产品如雨后春笋般不断涌现,VCD的出现已经使在家电市场上风光多年的录相机看到了生命之路的尽头(想想看,自从VCD出现后,电视,报刊杂志上还有录相机的广告吗?);而以生产MPEG解码芯片著称的C-CUBE,却赚得碗满钵溢。市场的竞争是惨烈的,拥有先进的技术,找准市场的方向,才是企业兴旺的出路。面对MPEG技术的不断发展,企业是否能跟得上潮流的变化,能否利用更新的技术,开拓出更广阔的市场,这都是值得认真思考的;就象原英特尔公司总裁安德鲁.葛洛夫先生的一本书名所述:“只有偏执狂才能生存。
★ H.261是最早的视频编码标准,是ITU-T为在综合业务数字网(ISDN)上开展双向声像业务(可视电话、视频会议)而制定的,和ISDN信道相匹配,其输出码率是p×64kbit/s,因此H.261又称为px64标准,其中p是1到30的可变参数。p取值较小时,只能传清晰度不太高的图像,如P=1或2,支持四分之一中间格式QCIF(Quarlity Common Interfmedia Format)的帧率较低的视频电话;p取值较大时,如 p>6,支持通用中间格式CIF(Common Interfmedia Format)的帧率较高的清晰度较好的会议电视图像。要说明的是:H.261只对CIF和QCIF两种图像格式进行处理。(CIF和QCIF格式如表2-2所示。注:CIF和QCIF帧频是每秒30帧).
H.261采用的算法结合了可减少时间冗余的帧间预测和可减少空间冗余的DCT变换的混合编码方法,特点是压缩比高、算法复杂度低。H.261详细制定了视频编码的各个部分,包括运动补偿的帧间预测、DCT变换、量化、熵编码,以及与固定速率的信道相适配的速率控制等部分。H.261实际的编码算法类似于MPEG算法,但不能与后者兼容,在实时编码时比MPEG所占用的CPU运算量少得多,此算法为了优化带宽占用量,引进了在图像质量与运动幅度之间的平衡折中机制,也就是说,剧烈运动的图像比相对静止的图像质量要差。因此这种方法是属于恒定码流可变质量编码而非恒定质量可变码流编码。
★ H.263是ITU-T为低码流通信而设计的,实质上H.263以及后来的H.263 和H.263 已发展成支持全码率应用的建议,从它支持众多的图像格式这一点就可看出,如Sub-QCIF、QCIF、CIF、4CIF甚至16CIF等格式。H.263核心技术是基于块的DCT变换和运动估计与预测技术,其编码算法与H.261一样,将编码过程分为帧内编码和帧间编码两个部分,但做了一些改进以提高性能和纠错能力,如在I帧内用改进的DCT 变换并量化,在帧间采用半象素运动矢量预测补偿技术,使运动补偿更加精确,量化后适用改进的变长编码表。目前H.263基本取代了H.261。
与H.261相比,H.263的码率可以更低,单位码率可以小于64K,在低码率下能够提供比H.261更好的图像效果,且支持的原始图像格式更多。H.263的编码速度快,其设计编码延时不超过150ms;码率低,在512 K 乃至 384K 带宽下仍可得到相当满意的图像效果,十分适用于需要双向编解码并传输的场合(如:可视电话)和网络条件不是很好的场合(如:远程监控)。
H.263与H.261的区别还有:(1)H.263的运动补偿使用半象素精度,而H.261则用全象素精度和循环滤波;(2)数据流层次结构的某些部分在H.263中是可选的,使得编解码可以配置成更低的数据率或更好的纠错能力;(3)H.263包含四个可协商的选项以改善性能;(4)H.263采用无限制的运动向量以及基于语法的算术编码;(5)采用事先预测和与MPEG中的P-B帧一样的帧预测方法;(6)H.263支持5种分辨率,即除了支持H.261中所支持的QCIF和CIF外,还支持SQCIF、4CIF和16CIF,SQCIF相当于QCIF一半的分辨率,而4CIF和16CIF分别为CIF的4倍和16倍。
★ 1998年IUT-T推出的H.263+是H.263建议的第2版,它在保证H.263标准核心句法和语义不变的基础上,提供了12个新的可协商模式和其他特征,以提高压缩效率或改善某方面的功能,增强应用的灵活性。如H.263只有5种视频源格式,H.263+允许使用更多的视频源格式,允许自定义图像的尺寸,从而拓宽了标准使用的范围,使之可以处理基于视窗的计算机图像、更高帧频的图像序列及宽屏图像。另一重要的改进是可扩展性,它允许多显示率、多速率及多分辨率,增强了视频信息在易误码、易丢包异构网络环境下的传输。
为提高压缩效率,H.263 采用先进的帧内编码模式;增强的PB-帧模式改进了H.263的不足,增强了帧间预测的效果;去块效应滤波器不仅提高了压缩效率,而且提供重建图像的主观质量。为适应网络传输,H.263 增加了时间分级、信噪比和空间分级,对在噪声信道和存在大量包丢失的网络中传送视频信号很有意义;另外,片结构模式、参考帧选择模式增强了视频传输的抗误码能力。
★ H263 在H263 基础上增加了3个选项,主要是为了增强码流在恶劣信道上的抗误码性能,同时为了提高编码效率。这3个选项为:选项U——称为增强型参考帧选择,它能够提供增强的编码效率和信道错误再生能力(特别是在包丢失的情形下),需要设计多缓冲区用于存贮多参考帧图像。选项V——称为数据分片,它能够提供增强型的抗误码能力(特别是在传输过程中本地数据被破坏的情况下),通过分离视频码流中DCT的系数头和运动矢量数据,采用可逆编码方式保护运动矢量。选项W——在H263 的码流中增加补充信息,保证增强型的反向兼容性,附加信息包括:指示采用的定点IDCT、图像信息和信息类型、任意的二进制数据、文本、重复的图像头、交替的场指示、稀疏的参考帧识别。
★ H.264/AVC是ITU-T和ISO/IEC联合制定的最新编码标准,它最先由ITU-T的视频编码专家组(VCEG)于1997年提出,目标是提出一种更高性能(相对于当时的H.263)的视频编码标准。1996年制定H.263标准后,ITU-T的VCEG开始了两个方面的研究:一个是短期研究计划,在H.263基础上增加选项(之后产生了H.263 与H.263 );另一个是长期研究计划,制定一种新标准以支持低码率的视频通信。长期研究计划产生了H.26L标准草案,在压缩效率方面与先期的ITU-T视频压缩标准相比,具有明显的优越性。2001年,ISO的MPEG组织认识到H.26L潜在的优势,随后ISO与ITU开始组建包括来自ISO/IEC MPEG与ITU-T VCEG的联合视频组(JVT),JVT的主要任务就是将H.26L草案发展为一个国际性标准。于是,在ISO/IEC中该标准命名为AVC(Advanced Video Coding),作为MPEG-4标准的第10个选项;在ITU-T中正式命名为H.264标准。
H.264的主要优点
1)在相同的重建图像质量下,H.264比H.263和MPEG-4(SP)减小50%码率。2)对信道时延的适应性较强,既可工作于低时延模式以满足实时业务,如会议电视等;又可工作于无时延限制的场合,如视频存储等。3)提高网络适应性,采用“网络友好”的结构和语法,加强对误码和丢包的处理,提高解码器的差错恢复能力。4)在编/解码器中采用复杂度可分级设计,在图像质量和编码处理之间可分级,以适应不同复杂度的应用。
H.264标准具有算法简单易于实现、运算精度高且不溢出、运算速度快、占用内存小、消弱块效应等优点,与以往的视频编码标准相比,H.264建议在其系统结构、运动估计和运动补偿、宏块的变换和量化以及熵编码等各方面都有明显的提高,具有更高的编码效率和更强的网络适应性。它是一种更为实用有效的图像编码标准。
(2)常见的视频格式
★ AVI---AVI文件
AVI是音频视频交错(Audio Video Interleaved)的英文缩写,它是Microsoft公司开发的一种符合RIFF文件规范的数字音频与视频文件格式,原先用于Microsoft Video for Windows (简称VFW)环境,现在已被Windows 95/98、OS/2等多数操作系统直接支持。AVI格式允许视频和音频交错在一起同步播放,支持256色和RLE压缩,但AVI文件并未限定压缩标准,因此,AVI文件格式只是作为控制界面上的标准,不具有兼容性,用不同压缩算法生成的AVI文件,必须使用相应的解压缩算法才能播放出来。常用的AVI播放驱动程序,主要是Microsoft Video for Windows或Windows 95/98中的Video 1,以及Intel公司的Indeo Video。AVI文件目前主要应用在多媒体光盘上,用来保存电影、电视等各种影像信息,有时也出现在Internet上,供用户下载、欣赏新影片的精彩片断。
★ .MPEG/.MPG/.DAT---MPEG文件
MPEG文件格式是运动图像压缩算法的国际标准,它采用有损压缩方法减少运动图像中的冗余信息,同时保证每秒30帧的图像动态刷新率,已被几乎所有的计算机平台共同支持。MPEG标准包括MPEG视频、MPEG音频和MPEG系统(视频、音频同步)三个部分,而Video CD (VCD)、Super VCD (SVCD)、DVD (Digital Versatile Disk)则是全面采用MPEG技术所产生出来的新型消费类电子产品。MPEG压缩标准是针对运动图像而设计的,其基本方法是:在单位时间内采集并保存第一帧信息,然后只存储其余帧相对第一帧发生变化的部分,从而达到压缩的目的,它主要采用两个基本压缩技术:运动补偿技术(预测编码和插补码)实现时间上的压缩,变换域(离散余弦变换DCT)压缩技术实现空间上的压缩。MPEG的平均压缩比为50∶1,最高可达200∶1,压缩效率非常高,同时图像和音响的质量也非常好,并且在微机上有统一的标准格式,兼容性相当好。
这里值得注意的是DIVX。DIVX 视频编码技术可以说是一种对 DVD 造成威胁的新生视频压缩格式,也有人说它是 DVD 杀手,它由 Microsoft mpeg4 v3 修改而来,使用了MPEG4的压缩算法。同时它也可以说是为了打破 ASF 的种种协定而发展出来的。而使用这种据说是美国禁止出口的编码技术MPEG4 压缩一部 DVD 只需要 2 张 CDROM。这样就意味着读者不需要额外购买DVD光驱也可以得到和它差不多的视频质量。而且播放这种编码,对机器的要求也不高,CPU的最低额度只要求在300MHZ 以上,而且在CPU类型的选择方面,不论你的芯是PII、CELERON还是PIII、AMDK6/2、AMDK6III、ATHALON,就是CYRIXx86也可以统吃拿下。在配置上64 兆内存和一个 8兆显存的显卡上,DIVX便可以流畅的播放了。
★ .RA/.RM/.RMVB---RealVideo文件
RealVideo文件是RealNetworks公司开发的一种新型流式视频文件格式,它包含在RealNetworks公司所制定的音频视频压缩规范RealMedia中,主要用来在低速率的广域网上实时传输活动视频影像,可以根据网络数据传输速率的不同而采用不同的压缩比率,从而实现影像数据的实时传送和实时播放。RealVideo除了可以以普通的视频文件形式播放之外,还可以与RealServer服务器相配合,在数据传输过程中边下载边播放视频影像,而不必像大多数视频文件那样,必须先下载然后才能播放。目前,Internet上已有不少网站利用RealVideo技术进行重大事件的实况转播。
RMVB影片格式比原先的RM多了VB两字,在这里VB是VBR(Variable Bit Rate--可变比特率)的缩写。在保证了平均采样率的基础上,设定了一般为平均采样率两倍的最大采样率值,在处理较复杂的动态影像时也能得到比较良好的效果,处理一般静止画面时则灵活的转换至较低的采样率,有效的缩减了文件的大小!
★ .MOV/.QT---QuickTime文件
QuickTime是Apple计算机公司开发的一种音频、视频文件格式,用于保存音频和视频信息,具有先进的视频和音频功能,被包括Apple Mac OS、Microsoft Windows 95/98/NT在内的所有主流电脑平台支持。QuickTime文件格式支持25位彩色,支持RLE、JPEG等领先的集成压缩技术,提供150多种视频效果,并配有提供了200多种MIDI兼容音响和设备的声音装置。新版的QuickTime进一步扩展了原有功能,包含了基于Internet应用的关键特性,能够通过Internet提供实时的数字化信息流、工作流与文件回放功能,此外,QuickTime还采用了一种称为QuickTime VR (简作QTVR)技术的虚拟现实(Virtual Reality, VR)技术,用户通过鼠标或键盘的交互式控制,可以观察某一地点周围360度的景像,或者从空间任何角度观察某一物体。QuickTime以其领先的多媒体技术和跨平台特性、较小的存储空间要求、技术细节的独立性以及系统的高度开放性,得到业界的广泛认可,目前已成为数字媒体软件技术领域的事实上的工业标准。国际标准化组织(ISO)最近选择QuickTime文件格式作为开发MPEG?4规范的统一数字媒体存储格式。
★ .ASF/.WMV----MICROSOFT流媒体文件
Microsoft公司推出的Advanced Streaming Format (ASF,高级流格式),也是一个在Internet上实时传播多媒体的技术标准,Microsoft公司的野心很大,希图用ASF取代QuickTime之类的技术标准。ASF的主要优点包括:本地或网络回放、可扩充的媒体类型、部件下载、以及扩展性等。ASF应用的主要部件是NetShow服务器和NetShow播放器。有独立的编码器将媒体信息编译成ASF流,然后发送到NetShow服务器,再由NetShow服务器将ASF流发送给网络上的所有NetShow播放器,从而实现单路广播或多路广播。这和Real系统的实时转播则是大同小异。
WMV又是一种独立于编码方式的在Internet上实时传播多媒体的技术标准,Microsoft公司希望用其取代QuickTime之类的技术标准以及WAV、AVI之类的文件扩展名。wmv的主要优点包括:本地或网络回放、可扩充的媒体类型、部件下载、可伸缩的媒体类型、流的优先级化、多语言支持、环境独立性、丰富的流间关系以及扩展性等。
★ .AVI(n AVI)
如果你发现原来的播放器突然打不开这种格式的avi文件了,那你就要考虑是不是碰到了n AVI。n AVI是 newAVI 的缩写,是一个名为 ShadowRealm 的地下组织发展起来的一种新视频格式。它是由 Microsoft ASF 压缩算法的修改而来的(并不是想象中的 AVI),视频格式追求的无非是压缩率和图象质量,所以 NAVI 为了追求这个目标,改善了原始的 ASF 格式的一些不足,让 NAVI 可以拥有更高的帧率(frame rate)。当然,这是牺牲 ASF 的视频流特性作为代价的。概括来说, NAVI 就是一种去掉视频流特性的改良型 ASF 格式,也可以被视为是非网络版本的 ASF 。
播放器编辑本段回目录
![]() |
电影 |
RealPlayer是有RealNetworks公司出品,目前最新版本是RealPlayer 11。支持播放在各种在线媒体视频,包括Flash, FLV格式或者MOV格式等等,并且在播放过程中能够录制视频。同时还加入了在线视频的一键下载功能到浏览器中,支持IE和Firefox,这样便能够下载YouTube, MSN,Google Video等等在线视频到本地硬盘来离线观看。而且还加入了DVD/VCD视频刻录的功能。另外官方声明中便指出RealPlayer 11将对Windows Vista支持不佳,会影响Aero效果等等。
2、暴风影音
暴风影音是由北京暴风网际科技有限公司出品,目前最新版本暴风影音3.6 智能高清版 (3.08.05.15),几乎支持任何流行影音、流媒体文件格式的播放器。
3、超级解霸
超级解霸目前最新版本是超级解霸3500.2.1全新Vsita 增强版,具有全编码格式以及影音互动的全面解决方案
支持格式众多,新增50多种格式支持,超强纠错,高清影视——独门DIRECTDVD CD/CD技术,HDFT增益滤波高清影像技术。
4、KMPlayer
KMPlayer是来自韩国的一套将网络上所有能见得到的解码程式(Codec)全部收集于一身的影音全能播放器。几乎可以播放系统上所有的影音文件。 通过各种插件扩展KMPlayer可以支持层出不穷的新格式。直接从Winamp继承的插件功能,能够直接使用Winamp的音频,输入,视觉效果插件, 而通过独有的扩展能力,可以选择使用不同解码器对各种格式进行解码。
Apple QuickTime 视频文件播放程序,包含 QuickTime Plug-in 和 QuickTime VR 。现在用QuickTime来做影音播放的少,但是很多游戏的视频解码部分需要QuickTime解码支持,所以QuickTime的应用还有很大的潜力。
Windows Media Player 微软出品,目前最新版本Windows Media Player 11 。
综合以上几款主流的播放器,各有优缺点。这几种播放器(除了QuickTime)几乎都在宣称自己是万能的播放器,可以播放任何格式,但是这种支持是要安装更多的插件,以对任何一种视频格式提供支持。这样做的优点是只安装一个播放器就可以播放所有的影音文件。但缺点也很明显,安装再多的插件,只能提供最基本的播放,牺牲了一些专有播放器的功能,有时难免出现错误;不能对所有的格式提供优化,占用大量的系统资源;另外也是播放器的体积变得越来越臃肿。RealPlayer是RM、RMVB格式的专用播放器,网络上流行的影音文件很多是RM、RMVB格式。这种格式的优点在于清晰度高,体积小,便于网络传输,这也是它流行的原因所在。暴风影音确实可以称作万能播放器,几乎可以播放所有流行的影音文件,但是对RM、RMVB格式的影音文件支持不是很好,这可能是因为RM、RMVB格式的封装太过严密。超级解霸特别适合播放VCD、DVD,但对于网络文件没有优势。KMPlayer和暴风影音相仿。QuickTime是MOV、QT格式的专有播放器,但是这两种格式的影音文件不利于网络传输,所以很少用到QuickTime,但是又不能忽略QuickTime,因为很多游戏的视频解码部分,需要QuickTime解码器。Windows Media Player微软自家的产品,对微软指定的格式有很好的支持,如AVI、ASF、WMV等格式。
压制方法编辑本段回目录
![]() |
电影 |
所谓DVDRip.就是用DivX压缩技术对DVD碟片的视频图像进行高质量的压缩.用MP3或AC3对音频进行压缩.然后将视频.音频部分合并成一个AVI文件(AVI即Audio Video lnterleaved.音频视频交错).最后再加上外挂的字幕文件数分之一.注意.当DVD转成DVDRip后.损失掉一些如菜单导航.音轨选择.分段选择等DVD特性.不过相对于它的优点和从便于收藏交流等方面考虑.这些损失都是微不足道的.
2.RMVB
该格式由RM影片格式升级延伸而来.VB即VBR.是Variable Bit Rate(可改变之比特率)的英文缩写.它打破了以前RM格式平均压缩采样的方式.在保证平均压缩比的基础上.合理利用了比特率资源.使RMVB在牺牲少部分影片质量的情况下.最大限度地压缩了影片的大小.最终拥有了近乎完美的接近于DVD品质的视听效果.
相比DVDRip.RMVB的优势不言而喻.首先在保证影片整体视听效果的前提下.RMVB的个头只有300MB-450MB左右(以90分钟标准电影计算).而DVDRip却需要700MB甚至更多.此外.它还拥有内置字幕.无需外挂插件支持.播放时系统占用率低等优点.这些优势使它已成为当前网络电影的真正主流格式.
3.MKV
被很多朋友认为是颠覆DVDRip的未来主流媒体格式.它实际上是一种新型多媒体封装格式.也称多媒体容器(Multimedia Container).它不同于DivX.XviD等视频编码格式.也不同于MP3.Ogg等音频编码格式.MKV只是为这些音.视频提供外壳的"组合"和"封装"格式.换句话说就是一种容器格式.常见的AVI.VOB.MPEG.RM格式其实也都属于这种类型.但它们要么结构陈旧.要么不够开放.这才促成了MKV这类新型多媒体封装格式的诞生.
MKV最大的特点就是能容纳多种不同类型编码的视频.音频及字幕流.甚至连非常封闭的RealMediae及QuickTime这类流媒体也被它囊括进去.可以说是对传统媒体格式的一次大颠覆.几乎变成了一个万能的媒体容器.
音频文件编辑本段回目录
![]() |
音频播放器 |
1、MP3
MP3的全称是Moving Picture Experts Group Audio Layer III。简单的说,MP3就是一种音频压缩技术,由于这种压缩方式的全称叫MPEG Audio Layer3,所以人们把它简称为MP3。MP3是利用 MPEG Audio Layer 3 的技术,将音乐以1:10 甚至 1:12 的压缩率,压缩成容量较小的file,换句话说,能够在音质丢失很小的情况下把文件压缩到更小的程度。而且还非常好的保持了原来的音质。正是因为MP3体积小,音质高的特点使得MP3格式几乎成为网上音乐的代名词。每分钟音乐的MP3格式只有1MB左右大小,这样每首歌的大小只有3-4兆字节。使用MP3播放器对MP3文件进行实时的解压缩(解码),这样,高品质的MP3音乐就播放出来了。
2、WAV
WAV格式是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持。WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用44.1kHz的采样频率,16位量化位数,因此WAV的音质与CD相差无几,但WAV格式对存储空间需求太大不便于交流和传播。
3、FLAC
FLAC代表 Free Lossless Audio Codec - 免费的无损音频压缩。简而言之,FLAC与MP3相仿,但是是无损压缩的,也就是说音频以FLAC方式压缩不会丢失任何信息。这种压缩与Zip的方式类似,但是FLAC将给你更大的压缩比率,因为FLAC是专门针对音频的特点设计的压缩方式,并且你可以使用播放器播放FLAC压缩的文件,就象通常播放你的MP3文件一样(现在已经有许多汽车播放器和家用音响设备支持FLAC,在FLAC的网站上你可以找到这些设备厂家的连接)。
FLAC是免费的并且支持大多数的操作系统,包括Windows, " unix" (Linux, *BSD, Solaris, OS X, IRIX), BeOS, OS/2, 和Amiga。并且FLAC提供了在开发工具autotools, MSVC, Watcom C, 和Project Builder上的build系统。
FLAC项目包括以下几个方面:数据流的格式以库的形式提供的参考编码器和解码器 flac, 一个以命令行方式工作的可以编解码FLAC文件的程序(译注:有些象Lame吧?) metaflac, 以命令行方式工作的FLAC文件的metadata编辑器不同音频播放器的输入插件.
我们所说的“FLAC是免费的”不仅仅意味着你可以不花钱而得到它。更重要的是FLAC的文件格式是对公众完全开放的,你可以以任何目的使用它(FLAC 项目只保留维护 FLAC 格式规格和确认兼容特性的权利),FLAC的文件格式和编码/解码的实现方式都不受任何已知专利的限制。还有,所有的源代码都在开放源代码的授权方式下可以得到。 FLAC是世界上第一个完全开放和免费的无损音频压缩格式。
FLAC的特性:
无损失压缩:被编码的音频(PCM)数据没有任何信息损失,解码输出的音频与编码器的输入的每一个字节都是一样的。每个数据帧都有一个当前帧的 16-bit CRC 校验码,用于监测数据传输错误。对整段音频数据,在文件头中还保存有一个针对原始未压缩音频数据的MD5标记,用于在解码和测试时对数据进行校验。
快速:FLAC更看重解码的速度。解码只需要整数运算,并且相对于大多数编码方式而言,对计算速度要求很低。在很普通的硬件上就可以轻松实现实时解码。
硬件支持:由于FLAC提供了免费的解码范例,而且解码的复杂程度低,所以FLAC是目前唯一获得硬件支持的无损压缩编码。
可以流化:FLAC的每个数据帧都包含了解码所需的全部信息。解码当前帧无需参照它前面或后面的数据帧。FLAC使用了同步代码和CRC(类似于MPEG等编码格式),这样解码器在数据流中跳跃定位时可以有最小的时间延迟。
可以定位:FLAC支持快速采样精确定位。这不仅对于播放有益,更使得FLAC文件便于编辑。
富于弹性的metadata:可以定义和实现新类型的metadata数据块,而不会影响旧的数据流和解码器的使用。目前已有的metadata类型包括tag,cue表,和定位表。 已经注册的应用程序可以定义自己专用的metadata类型(译注:这一点与MIDI标准相似)。
非常适合于存档应用:FLAC是一个开放的编码格式,并且没有任何数据的损失,你可以将它转换为你需要的任何其他格式。除了每个数据帧的CRC和MD5标记对数据完整性的保障,flac(译注:FLAC项目提供的命令行方式编码工具)还提供了一个verify(校验)选项,当使用该选项进行编码的时候,编码的同时就会立即对已编码数据进行解码并与原始输入数据进行比较,一旦发现不同就会退出并且报警提示。
便于对CD进行备份:FLAC有一个“cue表”metadata数据块用于保存CD的内容列表和所有音轨的索引点。你可以将一张CD保存到一个单一文件,并导入CD的cue表格,这样一个FLAC文件就可以完整地记录整张CD的全部信息。当你的原来的CD损坏的时候,你就可以用这个文件恢复出与原来一模一样的CD副本。
抗损伤:由于FLAC的帧结构,使得一旦发生数据流的损坏,损失会被限制在受损伤的数据帧之内。一般只是会丢失很短的一个片段。而很多其他无损音频压缩格式在遇到损伤的时候,一个损伤就会造成后面所有数据的丢失。
FLAC不具有的特性:
数据缩水。FLAC是专门并且仅仅为无损压缩而设计的,您可以选用许多其他优秀的有损压缩方式如Vorbis, MPC, 和MP3(LAME提供了一个优秀的开放源代码的实现)。
SDMI(例如cetera)兼容。FLAC不准备支持任何复制保护方法,实际上这些手段最终都是在浪费数据。(从另一个角度看,由于所有这些手段最终都被证明是无效的,所以也可以说FLAC把这些无用数据压缩到了零!)当然我们不能阻止某些人利用专用的metablock进行复制保护,但是他们的保护只会在他们自己解码产品上有效,其他解码器会跳过这些专门的metablock的。
4、APE
APE格式对于普通的用户来说肯定都不太了解,但是对于音乐发烧友来说,是再熟悉不过的了。而目前在网络相对发展的今天,无损压缩的APE音频文件已经成为人们追求的新对象,并逐步流行起来。音乐发烧友们以往不愿意使用MP3播放器而坚持使用CD,是因为觉得MP3是一种有损的音频压缩格式,在音质上无法满足发烧友们的需求。而随着炬力CTW500方案对APE格式的支持,这就让CD仅有的优势也淡然无存,使音乐发烧友有了充分的理由淘汰CD机而选择更为方便的MP3。
APE是目前流行的、由Monkey's Audio出品的一种数字音乐文件格式,与MP3、OGG这类有损压缩方式不同,APE是目前世界上惟一得到公认的音频无损压缩格式,也就是说当您将从音频CD上读取的音频数据文件压缩成APE格式后,您还可以再将APE格式的文件还原,而还原后的音乐文件与压缩前一模一样,没有任何损失。而现在越来越多的人将它在网络传播,因为被压缩后的APE文件容量要比WAV源文件小一半多,可以节约传输所用的时间,也更方便传播!由于APE的采样率高达800kbps~1400kbps,接近于音乐CD的1411.2kbps,远远高于MP3的128kbps,因此它在压缩后的音质和源文件音质几乎毫无差异,其音质之佳已经过了严格的盲听测试,得到了全世界发烧友的公认。APE的这些特点,都是其他无损压缩格式所争相效仿的。
在APE出现之前,音乐迷们都认为以CD或者WAV来保存自己喜欢的音乐素材是最好的方法了,但APE的出现,足以使他们改变这种看法,因为APE既可以保持音乐信号的无损,又可以以比WAV高得多的压缩率(接近2:1)压缩WAV文件,而且可以无须解压而直接播放。由于压缩后的APE文件只有原文件一半左右大小,APE格式受到了许多音乐爱好者的喜爱,特别是对于希望通过网络传输音频CD的朋友来说,APE可以帮助他们节约大量的资源。APE如此流行,在网上也比较容易能下载到APE格式的文件。
主流的音频播放器:foobar2000、千千静听、Winamp
![]() |
foobar2000 |
Foobar2000 是一个 Windows 平台下的高级音频播放器.包含了一些播放增益支持、低内存占用等基本特色以及内置支持一些流行的音频格式.包括MP/mp3PRO、AAC/AAC+、M4A/MP4、WMA、APE、MPC、OGG、WAVE、CD、FLAC、RM、TTA、AIFF、AU等音频格式以及多种MOD和MIDI音乐,以及AVI、VCD、DVD等多种视频文件中的音频流,还支持CUE音轨索引文件。
通过简单便捷的操作,可以在多种音频格式之间进行轻松转换,包括上述所有格式(以及CD或DVD中的音频流)到WAVE、MP3、APE、WMA等格式的转换;通过基于COM接口的AddIn插件或第三方提供的命令行编码器还能支持更多格式的播放和转换。
![]() |
千千静听 |
千千静听是一款完全免费的音乐播放软件,集播放、音效、转换、歌词等众多功能于一身。其小巧精致、操作简捷、功能强大。
千千静听拥有自主研发的全新音频引擎,支持DirectSound、Kernel Streaming和ASIO等高级音频流输出方式、64比特混音、AddIn插件扩展技术,具有资源占用低、运行效率高,扩展能力强等特点。
![]() |
Winamp |
Winamp 是一个非常著名的高保真的音乐播放软件, 支持 MP3、MP2、MOD、S3M、MTM、ULT、XM、IT、669、CD-Audio、Line-In、WAV、VOC、AVI、OGG、WMV、MPG 等多种音频和视频格式。可以定制界面 Skins, 支持增强音频视觉和音频效果的 Plug-ins, 通过一些非常实用的扩展插件来增强其功能。
内涵与外延编辑本段回目录
一般来讲,我们平时所说的影音文件包括电影、电视节目、歌曲等,但是随着技术的发展与成熟,现在越来越多的3D动画、flash流行于网络。它们也具有影音文件的特征,可以观看,可以收听,所以这些也是影音文件。随着科技的发展,一定还会出现更多格式的影音文件。