由於數位傳輸的漸漸普及,使得語音傳輸亦由類比而漸趨數位化。所謂數位語音編碼 (digital speech coding ),乃是利用一串二進位的位元(bits),來代表一段語 音訊號,以利語音的數位儲存或傳輸編碼。 線性預估分析(Linear Prediction ),植基於對語音訊號的參數描述,為低位元率 語音編碼提供了一條有效而且成功的途徑。本篇論文從比較各種線性預估計算法(al gorithm )出發,來探討其在各種分析條件下的語音品質及行為表現,並設法引進時 域調程法(Time Domain Harmonic Scaling)做為其事前處理(Pre-processing), 用以減輕其運算負荷。進而探討語音線性預估參數的量化特性,並嘗試建立我們自己 編碼系統所使用的純量量化(acalar quantization )量化表以及向量量化的碼本( codebook)。 由於語音音框(frame )參數間存在的餘訊,使得進一步線性預估參數的資料壓縮成 為可能。在純量量化系統方面,我們分別從音框內插(frame in terpolation)及音 框重覆(frame repeating )的動態壓縮觀點,模擬了二套可變音框率(Variable Frame Rate VER)線性預估聲碼器(vocodor ),以達成低位元率(low bit rate) 語音編碼的目的。在1200 bps的位元率下,二套聲碼器皆能獲致和2400 bps位元率下 幾乎一致的品質。 我們再設法將此二種壓縮技巧,應用於語音的向量量化編碼器上,在沒有折損任何向 量量化語音品質的情況下,同時降低了向量量化聲碼器的位元率及減輕了其搜尋(se arch)的運算負荷。
|