一、聲音的基本概念
聲音是通過一定介質傳播的連續的波。
圖1 聲波
重要指標:
- 振幅:音量的大小
- 周期:重復出現的時間間隔
- 頻率:指信號每秒鐘變化的次數
聲音按頻率分類:
圖2 聲音的頻率(語音信號頻率范圍:300Hz-3kHz)
聲音的傳播攜帶了信息,它是人類傳播信息的一種主要媒體。 聲音的三種類型:
- 波形聲音:包含了所有聲音形式
- 語音:不僅是波形聲音,而且還有豐富的語言內涵(抽象→提取特征→意義理解)
- 音樂:與語音相比,形式更規范。音樂是符號化的聲音。
二、聲音的數字化
1.聲音信號的類型
2.聲音數字化過程
圖3 聲音數字化過程
3.聲音數字化過程示意圖
圖4 聲音數字化過程示意圖
4.聲音數字化三要素
采樣頻率
|
量化位數
|
聲道數
|
每秒鐘抽取聲波幅度樣本的次數
|
每個采樣點用多少二進制位表示數據范圍
|
使用聲音通道的個數
|
采樣頻率越高
聲音質量越好
數據量也越大
|
量化位數越多
音質越好
數據量也越大
|
立體聲比單聲道的表現力豐富,但數據量翻倍
|
11.025kHz
22.05 kHz
44.1 kHz
|
8位=256
16位=65536
|
單聲道
立體聲
|
5.聲音數字化的數據量
音頻數據量=采樣頻率×量化位數×聲道數/8(字節/秒)
采樣頻率
(kHz)
|
量化位數
(bit)
|
數據量(KB/s)
|
單聲道
|
立體聲
|
11.025
|
8
|
10.77
|
21.35
|
16
|
21.53
|
43.07
|
22.05
|
8
|
21.53
|
43.07
|
16
|
43.07
|
86.13
|
44.1
|
8
|
43.07
|
86.13
|
16
|
86.13
|
172.27
|
三、音頻的文件格式
1.WAV文件
WAV是Microsoft/IBM共同開發的PC波形文件。因未經壓縮,文件數據量很大。
特點:聲音層次豐富,還原音質好
2.MP3文件
MP3(MPEG Audio layer3)是一種按MPEG標準的音頻壓縮技術制作的音頻文件。
特點:高壓縮比(11:1),優美音質
3.WMA文件
WMA(Windows Media Audio)是Windows Media格式中的一個子集(音頻格式)。
特點:壓縮到MP3一半
4.MIDI文件
MIDI(樂器數字接口)是由一組聲音或樂器符號的集合。
特點:數據量很小,缺乏重現自然音
四、數字音頻壓縮標準
1.音頻壓縮方法概述
圖5
壓縮編碼技術是指用某種方法使數字化信息的編碼率降低的技術
音頻信號能壓縮的基本依據:
①聲音信號中存在大量的冗余度;
②人的聽覺具有強音能抑制同時存在的弱音現象。
音頻信號壓縮編碼的分類:
①無損壓縮(熵編碼)
霍夫曼編碼、算術編碼、行程編碼
②有損壓縮
波形編碼--PCM、DPCM、ADPCM 、子帶編碼、矢量量化
參數編碼--LPC
混合編碼--MPLPC、CELP
2.音頻壓縮技術標準
分類
|
標準
|
說明
|
電話語
音質量
|
G.711
|
采樣8kHz,量化8bit,碼率64kbps
|
G.721
|
采用ADPCM編碼,碼率32kbps
|
G.723
|
采用ADPCM有損壓縮,碼率24kbps
|
G.728
|
采用LD-CELP壓縮技術,碼率16kbps
|
調幅廣
播質量
|
G.722
|
采樣16kHz,量化14bit,碼率224(64)kbps
|
高保真
立體聲
|
MPEG
音頻
|
采樣44.1kHz,量化16bit,碼率705kbps (MPEG三個壓縮層次,384-64kbps)
|
五、聲卡
1.聲卡的主要功能
聲卡是負責錄音、播音和聲音合成的一種多媒體板卡。其功能包括:
①錄制、編輯和回放數字音頻文件
②控制和混合各聲源的音量
③記錄和回放時進行壓縮和解壓縮
④語音合成技術(朗讀文本)
⑤具有MIDI接口(樂器數字接口)
2.芯片類型
|