多媒体技术及其应用 (2/121)

< 上一篇下一篇 >
本帖地址: 复制地址

修改 回帖 引用 楼主: 小邪

用户形象图片

一、音频处理技术:首先向大家提个都比较熟悉的问题:录音磁带转录几次后,音质有否变化?为什么?答案是:每转录几次,都会使音质变差,所以原声磁带总比转录带音质要好些。这是因为一般的录音机是使用模拟方式录音的,磁带上记录的是声音经电-磁转换后的线性模拟磁通量。如果换成数字录音机,磁带记录的是数字信号,多次转录后音质有否变化?可以肯定的说:只要数字录音机是好的,不管你转录多少次,音质都是没有变化的!1、模拟/数字量的区别:模拟量:线性变化的量。比如声音,记录一个声音片断,声波反映在座标系上就是一根近似正弦波的连续曲线。这是用goldwave软件打开的一首歌曲的声波曲线图,从图中就可看出声波曲线的实际反映。模拟量的优点是放大/衰减信号比较方便,在电路中利用三极管的放大特性就很容易完成,因为反映在电信号上,只是电压的连续变化而已,传输也比较方便,对设备要求不高。缺点则比较多:一是易受干扰:就象我们听收音机,不管是调频还是调幅,都是模拟传输的,所以抗干扰能力很差(现在的有线电视也是如此)。打个雷或打开电吹风,就会造成强干扰,而且很难从技术上进行屏蔽。二是易失真:因电路本身存在晶体管交越失真、电路热噪声、饱和削波失真等等,经过电路处理后,总会存在失真,而且电路越复杂,失真越厉害(所以高保真音响一般电路设计都要求越简单越好)。三是后期制作比较困难:就如磁带录音后,再进行各种编辑就不方便了,而且每编辑一次,就增加一次失真,多编几次就不成样子了。四是存储不方便:模拟信息占用存储资源特别多,特别是音视频,通常用磁带保存,一般保存期限都不长。五是远程传输占用带宽较宽:我们知道,因为模拟信息易受干扰,不管是调频还是调幅(调相)方式传输,频率都不能相隔得太近,否则易造成邻频干扰甚至产生镜象(象电视中的网纹干扰、收音机一个频率下有时能收到几个台,互相串扰,结果一个都听不清)。数字量:非连续变化的量(非线性),它是用一连串的二进制数字来表示的量,方便计算机处理。缺点:量化(也就是把模拟量变成二进制数字串)比较麻烦,对设备要求高。另外,要求量化的格式要有高度的兼容性(不同的量化方式是互不兼容的,结果会造成互不认识的情况)。优点:抗干扰能力强、后期处理方便、存储方便、远程传输占用带宽小(保密性也好^_^),它是今后的发展方向。这里要说明计算机为什么要用二进制工作?为什么不用大家熟悉的十进制工作?我们知道,计算机是用电工作的,电的基本参数主要有三个:电阻、电流、电压,当一台计算机做好后,电阻原则上是不变的(如果一台计算机的电阻胡乱变的话,那这计算机就有问题了),当电阻不变时,电流、电压成正比,我们选电压这个比较直观的参数来衡量数据的变化,理论上十进制也是可以的:比方说电压为0V时表示0,电压为1V时表示1,电压2V时表示2……电压为9V时表示9,问题是这种表示方法对电压的稳定性要求太高,万一电压波动,2V降为1V,2岂不变成了1?这是不允许的!为解决这个问题,人们想出了用电压的两种基本状态来表示数据:不通电时电压为0V表示0,通电时电压不为0V表示1,因为这里只有两个状态:通电与不通电,不存在电压波动造成的影响,大大简化了电路的设计,所以计算都用二进制工作就是这个原因
小邪 (466384297) 于 2008-06-21 22:23:26 对此贴进行了编辑
回到帖子顶部

回帖 引用 1楼[楼主] 小邪

用户形象图片

1、数字音频:(1)、波形音频:我们知道了音波的性质后,剩下的问题就是怎样把模拟的声音(音频数据)变成数字音频了。这里还得知道:人的听觉范围是有限的,一般来说,人只能听到20Hz~20KHz的声音,低于20Hz的声音称次声波,高于20KHz的声音称超声波,通常6岁左右的小孩的听力是最好的,成年人对高频声音已不敏感,大约只能听到16KHz以下的声音了。对声波来说,我们可以近视把它看成正弦波。在座标系中,纵座标是波幅,通常用电压值的高低可以描述(在功放中的前级放大—电压放大就是放大波幅),横座标是时间,我们取一个周期的声波进行分析。要把这个周期的正弦波变成二进制数据,首先就要把瞬间的声音(曲线上的一个点)所对应的电压值用一组二进制数据来进行编码,考虑到现在的计算机处理速度很快,一般都是用16bit或32bit数据来编码(纵座标方向编码)。就算是用16位编码,也能表示65536种不同的电压值——这已经够精确了,如果是32位的话,足有4294967296种不同的编码了!这不仅大大超越了人耳的听觉极限,怕一般的工业仪器都测不出来了,呵呵。所以我们用来编码的位数还是很有讲究的:位数太少,失真明显,但数据量少,占据磁盘空间少;位数太多,几乎不失真(从数学角度来说,量化后失真是绝对的,不失真是相对的),但数据量很大,占据的磁盘空间大,后期处理及网络传输都比较困难。这就如我们取人名:取三个字的名吧,重名的多,为便于计算机管理,最好是没有重名的——那可能就要取很多汉字的名字才能实现,比方说一个人取20个字的名字可能不会出现重名了,但这人名记、写、叫、输入等就太困难了!所以只能折中处理。曲线上的任一点的电压值表示完后,还剩下横座标方向的编码。也就是单位时间内的声波曲线进行取样。取样密度应该多少合适?这又是个难题。理论上取样点越多(取样频率越高),丢失的细节越少,声音的保真度越高,但占据的磁盘空间就越大。因为人耳的听觉范围有限,一般我们按人耳能听到的高频端的最高值的两倍左右进行取样,已能保证声音的还原质量了(当然,可能会丢失很多高频的声音——但这些声音人耳是听不到的了)。所以一般的取样频率是44.1KHz(也就是每秒取样44100次)。按上述方式用二进制数值量化声波后,就把线性的模拟声音变成非线性的数字声音了(也就是变成了一串二进制数值串了),这种原始的数字化声音数据我们通常叫波形音频数据,保存在磁盘上的文件扩展名通常用WAV。我们想想看:数字声音数据按每秒种声音取44100个点,每个点用32位二进制数据来记录,比方说记录一首常见的歌曲,长度算5分钟吧,也就是300秒的数据——这可是非常巨大的数据量啊!因此,这种原始的音频数据只用在保真度比较高的场合:比方说音乐CD。而一般的场合因对声音的保真度要求不会特别高,通常都会把波形音频数据进行压缩。因此,如果你是一位音乐爱好者的话,要听音乐,音质最好的就是CD,至于DVD、VCD、MP3等都是压缩过了的,音质与CD是没法比的哟!所以一张CD光盘就算只记录单纯的声音数据,也只能存放10多首歌曲,要知道:一张CD光盘足有700多MB呢! 
2、MIDI(MusicalInstrumentDigitalInterface)音频。随着计算机技术的发展,人们又在思考另一个问题:现场录制声音再进行模/数(A/D)转换实在太麻烦,它要求要有较好的录音设备及模数转换卡,特别是对音乐爱好者来说,光“听”已不能解决问题,自己演奏才能过瘾,问题是每个人能掌握的乐器演奏技能有限,音乐的后期制作就更困难。能否通过计算机合成音乐?MIDI音频就给我们提供了这种条件。通俗地说,MIDI音频是一种在计算机磁盘上只记录音乐的基本特性(诸如频率、音高、速度等等),而不记录声音的具体波形的一种音频格式。或者说它不记录声音本身,而只记录构成声音的基本函数!你要听声音时,计算机就根据这些函数进行计算,算出基本的波形,再通过调制(一般是FM调制)“合成”声音来给你听!因为它只记录构成声音的“函数”,不记录声音本身,故占据的磁盘空间会很少,也因为要计算通过运算合成声音,所以要消耗一定的计算机资源(当然,现在的计算机处理声音那是小菜一碟了,呵呵),而且“合成”的声音肯定要比真实的声音要假噢!另外,因为人的声音合成比较难(每个人都有自己特定的音色呢),况且人的感情色彩特别浓厚,很难用计算机“合成”出来,所以MIDI音频一般用在合成纯乐器演奏的场合,特别是西洋乐器的演奏(民族乐器的音色库到如今都很少有,唉!)。为了解决“合成”的声音不真实的问题,人们还想出了把真的乐器演奏的音色做成音色库(这就是我们常见的“波表”),计算机通过函数调用现成的音色库的办法来合成声音,克服了MIDI音乐的固有缺憾。综上所述:波形音频失真小,但占据的磁盘空间大,因计算机磁盘保存波形音频时,就是保存声波本身,重放时把它简单地“读”出来就行,故占用计算机资源少。MIDI音频在计算机磁盘上只保存构成声音的“函数”,故占用的磁盘空间小,而且合成的声音终究没办法跟原汁原味的声音比,音质要差些;人声的合成比较困难(起码到目前为止还很难达到要求)。重放时要计算机“实时”地“运算”出声音,占用的计算机资源相对多些。
回到帖子顶部

回帖 引用 2楼[楼主] 小邪

用户形象图片

4、  音频压缩:波形音频因占据磁盘空间太大,特别是网络时代,数据量太大造成传输困难。因此人们通常采取压缩的办法,实际上是进行二次编码。现在兼容性比较好的编码都遵循PCM编码方式,其它的压缩编码也基本上以此为基础而进一步优化,就象容错码从曼彻斯特编码到差分曼彻斯特编码等一样,如MP3、WMA、OGG等。到网络时代来临以后,为了适应流媒体方式,编码格式就更多了,象Real、苹果的QUICKTime、微软的Media格式等等。这些压缩都是有损压缩(包括MP3格式也是有损压缩),后来又出现了APE、FLAC、LPAC、WavPack等无损压缩格式,只是压缩比不高。目前比较流行的是MP3压缩格式及WMA压缩格式,这两者都支持流媒体传输(边传送数据边播放,不象以前要听网络歌曲得先把这首歌全部下载才能放),只是不同速率的压缩其音质变化较大。目前网络上较多的是128KBPS的,音质比较差,要保证音质应该首选320KBPS的下载。要听高保真的,就只能选APE等无损压缩格式的歌曲(或音乐)了,它就是还原成CD音质也是很好的。

        这里要指出的是CD音乐光碟是以音轨的方式存储在光盘上的,它是未经编码的“处女”波形数据,CD碟上的文件只是一个索引,告诉计算机每一首歌在光盘上保存的起始及结束的位置,所以你把CD光盘上的“音乐文件”拷贝出来也仅仅是拷贝了一个索引文件而已,是放不出来的,必须要用抓轨软件把音轨“抓”出来保存为文件才可以放出来。另外,这种“处女”波形数据最怕破坏,一旦有一个数据读不出来,在重放时就会产生很明显的噪音,不象VCD或DVD等经过编码的音、视频数据,即便丢失了部分数据,因为有容错码的存在还能自动“找”回来,不怕干扰和破坏。你看卖VCD机子的地方,老板经常把碟子故意划烂(当然是纵向划,破坏的数据太多也是“找”不回来的),机子照样能读出来,以显示他的机子容错性好。而CD是绝对不行的!你不信你把CD碟划几刀,请卖机的老板放,无论他什么高级机子也照样放不出来完整的音乐。所以CD碟比较难做,一旦有“硬伤”肯定就报费了,因此通常CD碟比DVD、VCD都要贵(即便是盗版碟也贵啊)。
回到帖子顶部
个人信息
  • 荣誉+3
  • 荣誉+2
  • 荣誉+1
  • 荣誉-1
  • 荣誉-2
  • 荣誉-3
发表留言
  • 文章不错!
  • 精华好文!
  • 支持原创文章!
  • 帖子图文并茂,好!
  • 真知灼见,说得好!
  • 恶意广告
  • 违规内容
  • 严重灌水
  • 重复发帖
  • 标题党
你确定要删除此楼层吗
扣20点经验值

快速回复进入高级回复

插入图片 选择表情

验证码 看不清?换一张(不区分大小写)

[完成后按Ctrl+Enter发表]
[回复须知]