語音頻譜動態特徵和靜態特徵在語音辨認上,同樣扮演一個重要的特性,因為動態特 徵包含音素之間的轉移訊息。在這篇論文我們利用頻譜能量比例碼(SERC)的動態特徵 和靜態特徵組合,加上二元樹向量量化技巧建立一個多字彙的語音辨認系統。 為了提高系統的辨認速度,我們使用了一個快速的相似性字串比對器(PF474C),這個 比對器可以迅速地從參考資料庫中選出16個最相似的候選詞。然後計算測試詞和這些 候選詞的距離,距離最短者即為辨認詞。 我們利用上述方法做了一些實驗,對於多特定語者(multiple-speaker)和非特定語者 (speaker-independent) 之辨認,辨認率分別提高了2.1%和11.4% 。根據這些結果顯 示,利用SERC的動態特徵和靜態特徵組合,對於非特定語者語音驗辨認是非常有效的 。
|