MP3: MP3格式誕生于八十年代的德國,所謂的MP3也就是指的是MPEG標準中的音頻部分,也就是MPEG音頻層。
根據(jù)壓縮質(zhì)量和編碼處理的不同分為3層,分別對應(yīng)“*.mp1"/“*.mp2”/“*.mp3”這3種聲音文件。需要提醒大家注意的地方是:MPEG音頻文件的壓縮是一種有損壓縮,MPEG3音頻編碼具有10:1~12:1的高壓縮率,同時基本保持低音頻部分不失真,但是犧牲了聲音文件中12KHz到16KHz高音頻這部分的質(zhì)量來換取文件的尺寸,相同長度的音樂文件,用*.mp3格式來儲存,一般只有*.wav文件的1/10,而音質(zhì)要次于CD格式或WAV格式的聲音文件。
由于其文件尺寸小,音質(zhì)好;所以在它問世之初還沒有什么別的音頻格式可以與之匹敵,因而為*.mp3格式的發(fā)展提供了良好的條件。直到現(xiàn)在,這種格式還是風靡一時,作為主流音頻格式的地位難以被撼動。
但是樹大招風,MP3音樂的版權(quán)問題也一直是找不到辦法解決,因為MP3沒有版權(quán)保護技術(shù),說白了也就是誰都可以用。 MP3格式壓縮音樂的采樣頻率有很多種,可以用64Kbps或更低的采樣頻率節(jié)省空間,也可以用320Kbps的標準達到極高的音質(zhì)。
我們用裝有Fraunhofer IIS Mpeg Lyaer3的 MP3編碼器(現(xiàn)在效果最好的編碼器)MusicMatch Jukebox 6.0在128Kbps的頻率下編碼一首3分鐘的歌曲,得到2.82MB的MP3文件。采用缺省的CBR(固定采樣頻率)技術(shù)可以以固定的頻率采樣一首歌曲,而VBR(可變采樣頻率)則可以在音樂“忙”的時候加大采樣的頻率獲取更高的音質(zhì),不過產(chǎn)生的MP3文件可能在某些播放器上無法播放。
我們把VBR的級別設(shè)定成為與前面的CBR文件的音質(zhì)基本一樣,生成的VBR MP3文件為2.9MB。WMA: WMA (Windows Media Audio) 格式是來自于微軟的重量級選手,后臺強硬,音質(zhì)要強于MP3格式,更遠勝于RA格式,它和日本YAMAHA公司開發(fā)的VQF格式一樣,是以減少數(shù)據(jù)流量但保持音質(zhì)的方法來達到比MP3壓縮率更高的目的,WMA的壓縮率一般都可以達到1:18左右,WMA的另一個優(yōu)點是內(nèi)容提供商可以通過DRM(Digital Rights Management)方案如Windows Media Rights Manager 7加入防拷貝保護。
這種內(nèi)置了版權(quán)保護技術(shù)可以限制播放時間和播放次數(shù)甚至于播放的機器等等,這對被盜版攪得焦頭亂額的音樂公司來說可是一個福音,另外WMA還支持音頻流(Stream)技術(shù),適合在網(wǎng)絡(luò)上在線播放,作為微軟搶占網(wǎng)絡(luò)音樂的開路先鋒可以說是技術(shù)領(lǐng)先、風頭強勁,更方便的是不用象MP3那樣需要安裝額外的播放器,而Windows操作系統(tǒng)和Windows Media Player的無縫捆綁讓你只要安裝了windows操作系統(tǒng)就可以直接播放WMA音樂,新版本的Windows Media Player7.0更是增加了直接把CD光盤轉(zhuǎn)換為WMA聲音格式的功能,在新出品的操作系統(tǒng)Windows XP中,WMA是默認的編碼格式,大家知道Netscape的遭遇,現(xiàn)在“狼”又來了。WMA這種格式在錄制時可以對音質(zhì)進行調(diào)節(jié)。
同一格式,音質(zhì)好的可與CD媲美,壓縮率較高的可用于網(wǎng)絡(luò)廣播。雖然現(xiàn)在網(wǎng)絡(luò)上還不是很流行,但是在微軟的大規(guī)模推廣下已經(jīng)是得到了越來越多站點的承認和大力支持,在網(wǎng)絡(luò)音樂領(lǐng)域中直逼*.mp3,在網(wǎng)絡(luò)廣播方面,也正在瓜分Real打下的天下。
因此,幾乎所有的音頻格式都感受到了WMA格式的壓力。 RealAudi RealAudio主要適用于在網(wǎng)絡(luò)上的在線音樂欣賞,現(xiàn)在大多數(shù)的用戶仍然在使用56Kbps或更低速率的Modem,所以典型的回放并非最好的音質(zhì)。
有的下載站點會提示你根據(jù)你的Modem速率選擇最佳的Real文件?,F(xiàn)在real的的文件格式主要有這么幾種:有RA(RealAudio)、RM(RealMedia,RealAudio G2)、RMX(RealAudio Secured),還有更多。
這些格式的特點是可以隨網(wǎng)絡(luò)帶寬的不同而改變聲音的質(zhì)量,在保證大多數(shù)人聽到流暢聲音的前提下,令帶寬較富裕的聽眾獲得較好的音質(zhì)。WAV WAV格式是微軟公司開發(fā)的一種聲音文件格式,也叫波形聲音文件,是最早的數(shù)字音頻格式,被Windows平臺及其應(yīng)用程序廣泛支持。
WAV格式支持許多壓縮算法,支持多種音頻位數(shù)、采樣頻率和聲道,采用44.1kHz的采樣頻率,16位量化位數(shù),因此WAV的音質(zhì)與CD相差無幾,但WAV格式對存儲空間需求太大不便于交流和傳播。 WAV是一種文件格式,符合 PIFF Resource Interchange File Format規(guī)范。
所有的WAV都有一個文件頭,這個文件頭音頻流的編碼參數(shù)。WAV對音頻流的編碼沒有硬性規(guī)定,除了PCM之外,還有幾乎所有支持ACM規(guī)范的編碼都可以為WAV的音頻流進行編碼。
WAV也可以使用多種音頻編碼來壓縮其音頻流,不過我們常見的都是音頻流被PCM編碼處理的WAV,但這不表示W(wǎng)AV只能使用PCM編碼,MP3編碼同樣也可以運用在WAV中,和AVI一樣,只要安裝好了相應(yīng)的Decode,就可以欣賞這些WAV了。 在Windows平臺下,基于PCM編碼的WAV是被支持得最好的音頻格式,所有音頻軟件都能完美支持,由于本身可以達到較高的音質(zhì)的要求,因此,WAV也是音樂編輯創(chuàng)作的首選格式,適合保存音樂素材。
因此,基于PCM編碼的WAV被作為了一種中介的格式,常常使用在其他。
語音信號的數(shù)字化傳輸,一直是通信的發(fā)展方向之一。采用低速率語音編碼技術(shù)進行語音傳輸比語音信號模擬傳輸有諸多優(yōu)點,現(xiàn)代通信的發(fā)展趨勢決定了語音編碼技術(shù)的兩大突出優(yōu)勢:
大大節(jié)省了帶寬。從最初的PCM64k編碼到現(xiàn)在標準語音壓縮協(xié)議,如G.723編碼速率為5.3K或6.3Kbps;G.729編碼速率為8Kbps。還有未形成協(xié)議標準但更低的編碼速率已有成熟的算法可以實現(xiàn),如AMBE、CELP、RELP、VSELP、MELP、MP-MLQ、LPC-10等多種語音壓縮算法,最低編碼速率達到2.4kbps,有些算法已在包括第三代移動通信系統(tǒng)(3G)的多個領(lǐng)域得到應(yīng)用。
便于實現(xiàn)與IP融合。Internet的成功運用使得與IP的融合已成必然的發(fā)展趨勢。分組語音即將分組交換的概念與語音傳輸相結(jié)合,使得語音信息更易于接入IP網(wǎng)。而分組語音的關(guān)鍵技術(shù)之一就是語音編碼技術(shù),低速率的語音編碼技術(shù)對語音信息的實時性有更好的保證。采用分組語音傳輸?shù)木W(wǎng)絡(luò),其傳輸?shù)恼Z音信息本身就是分組數(shù)據(jù)包,這樣的語音信息在接入Internet時將是非常的方便。
語音編碼既可用軟件也可用硬件的方法實現(xiàn)。軟件實現(xiàn)就是將壓縮算法用軟件方法實現(xiàn),這樣做的好處是成本低、修改方便靈活,但處理速度較慢,不易保證處理的實時性。采用硬件實現(xiàn)就是將語音壓縮算法固化到專用DSP芯片中,這樣處理速度快,便于實時處理。
Mp3音樂所采用的聲音數(shù)據(jù)壓縮編碼的標準是 MPEG Audio Layer 3。
利用 MPEG Audio Layer 3 的技術(shù),將音樂以1:10 甚至 1:12 的壓縮率,壓縮成容量較小的文件,而對于大多數(shù)用戶來說重放的音質(zhì)與最初的不壓縮音頻相比沒有明顯的下降。
它是在1991年由位于德國埃爾朗根的研究組織Fraunhofer-Gesellschaft的一組工程師發(fā)明和標準化的。用MP3形式存儲的音樂就叫作MP3音樂,能播放MP3音樂的機器就叫作MP3播放器。
擴展資料:
因為MP3是一種有損壓縮格式,它提供了多種不同“比特率”(bit rate)的選項—也就是用來表示每秒音頻所需的編碼數(shù)據(jù)位數(shù)。
典型的速度介于128kbps和320kbps(kbit/s)之間。與此對照的是,CD上未經(jīng)壓縮的音頻比特率是1411.2 kbps(16 位/采樣點 * 44100 采樣點/秒 * 2 通道)。
使用較低比特率編碼的MP3文件通?;胤刨|(zhì)量較低。使用過低的比特率,“壓縮噪聲(compression artifact)”(原始錄音中沒有的聲音)將會在回放時出現(xiàn)。
說明壓縮噪聲的一個好例子是:壓縮歡呼的聲音;由于它的隨機性和急劇變化,所以編碼器的錯誤就會更明顯,并且聽起來就象回聲。
參考資料來源:搜狗百科-MP3
mp3
MP3全稱是動態(tài)影像專家壓縮標準音頻層面3(Moving Picture Experts Group Audio Layer III)。是當今較流行的一種數(shù)字音頻編碼和有損壓縮格式,它設(shè)計用來大幅度地降低音頻數(shù)據(jù)量,而對于大多數(shù)用戶來說重放的音質(zhì)與最初的不壓縮音頻相比沒有明顯的下降。它是在1991年由位于德國埃爾朗根的研究組織Fraunhofer-Gesellschaft的一組工程師發(fā)明和標準化的。
ape
APE是目前流行的數(shù)字音樂文件格式之一。與MP3這類有損壓縮方式不同,APE是一種無損壓縮音頻技術(shù),也就是說當你將從音頻CD上讀取的音頻數(shù)據(jù)文件壓縮成APE格式后,你還可以再將APE格式的文件還原,而還原后的音頻文件與壓縮前的一模一樣,沒有任何損失。APE的文件大小大概為CD的一半,但是隨著寬帶的普及,APE格式受到了許多音樂愛好者的喜愛,特別是對于希望通過網(wǎng)絡(luò)傳輸音頻CD的朋友來說,APE可以幫助他們節(jié)約大量的資源。
wma
WMA的全稱是Windows Media Audio,它是微軟公司推出的與MP3格式齊名的一種新的音頻格式。由于WMA在壓縮比和音質(zhì)方面都超過了MP3,更是遠勝于RA(Real Audio),即使在較低的采樣頻率下也能產(chǎn)生較好的音質(zhì)。
在64kbps的數(shù)據(jù)速率時,在13000-20000Hz頻率段就能保留了大部分信息。
但64kbps的WMA的低頻表現(xiàn)實在有點令人失望,聽上去比較硬,如同加入了哇聲效果般,感覺非常不好,當然比同比特64K的mp3要好感覺聲音更集中。聽覺上64WMA的表現(xiàn)基本接近128kbps mp3的音質(zhì)水平,但沒有達到。96K的wma略好于128K的mp3,WMA在高于128以上的各種比特率表現(xiàn)相差不大,高頻和泛音都很豐富,一般人聽不出WMA128Kbps以上的音質(zhì)和音色的差異,總體感覺WMA的聲音偏硬,適合流行搖滾,如果是古典或者純?nèi)寺暤脑?,感覺有點生硬,在低于128K時,WMA對于MP3擁有絕對優(yōu)勢!128以上的WMA相比MP3會有薄的感覺。
在128kbps及以下碼流的試聽中WMA完全超過了MP3格式,低碼流之王不是浪得虛名的。但是當碼流上升到128kbp以后,WMA的音質(zhì)卻并沒有如MP3一樣隨著碼流的提高而大大提升。
flac
FLAC即是Free Lossless Audio Codec的縮寫,中文可解為無損音頻壓縮編碼。FLAC是一套著名的自由音頻壓縮編碼,其特點是無損壓縮。不同于其他有損壓縮編碼如MP3 及 AAC,它不會破任何原有的音頻資訊,所以可以還原音樂光盤音質(zhì)?,F(xiàn)在它已被很多軟件及硬件音頻產(chǎn)品所支持。
簡而言之,F(xiàn)LAC與MP3相仿,但是是無損壓縮的,也就是說音頻以FLAC方式壓縮不會丟失任何信息。這種壓縮與Zip的方式類似,但是FLAC將給你更大的壓縮比率,因為FLAC是專門針對音頻的特點設(shè)計的壓縮方式,并且你可以使用播放器播放FLAC壓縮的文件,就象通常播放你的MP3文件一樣(現(xiàn)在已經(jīng)有許多汽車播放器和家用音響設(shè)備支持FLAC,在FLAC的網(wǎng)站上你可以找到這些設(shè)備廠家的連接)。
FLAC是免費的并且支持大多數(shù)的操作系統(tǒng),包括Windows,“unix” (Linux, *BSD,Solaris,OS X,IRIX),BeOS,OS/2,和Amiga。并且FLAC提供了在開發(fā)工具autotools,MSVC,Watcom C,和Project Builder上的build系統(tǒng)。
一、語音壓縮編碼類別
語音信號的數(shù)字編碼方法主要分成三類:波形編碼、參數(shù)編碼和混合編碼??磮D1
二、語音壓縮編碼的定義
1. 波形編碼是對語音時域或頻域波形進行編碼,由于這種系統(tǒng)保留原始樣值的細節(jié)從而保留了信號的各種過度特征,因此解碼聲音質(zhì)量較高,但此系統(tǒng)編碼碼率較高壓縮比不大。
2. 參數(shù)編碼的基礎(chǔ)是利用人類語音的生成模型,這樣在傳輸過程中只需要傳送模型的參數(shù),大大降低了系統(tǒng)的碼率,特別適合于無線通信,保密和軍事通信領(lǐng)域。參數(shù)編碼的缺點在于回復的語音質(zhì)量較差。采用參數(shù)編碼方法的編碼器有時稱聲碼器。
3. 混合編碼是波形編碼和參數(shù)編碼的結(jié)合。它既利用了語音的生成模型,減少了傳輸碼率,又使解碼的語音產(chǎn)生接近原始語音的波形,以保留說話人的各種自然特征,因此當各種國際標準通常采用這種方法。
聲明:本網(wǎng)站尊重并保護知識產(chǎn)權(quán),根據(jù)《信息網(wǎng)絡(luò)傳播權(quán)保護條例》,如果我們轉(zhuǎn)載的作品侵犯了您的權(quán)利,請在一個月內(nèi)通知我們,我們會及時刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學習鳥. 頁面生成時間:3.431秒