|
隨著科技的發展, 目前電腦已成為現代人必備的工具, 為使電腦更具親和 力, 以語音與電腦溝通將是解決中文電腦輸入不便最佳的方法. 對於語音 資料一般以音框的方式處理, 並做為特徵值擷取的基準, 本文中我們首先 以語音的結構特性,將語音資料段分成非帶聲(unvoice),帶聲(voice) ,尾 音弱聲(nonvoice)等三段, 並依各段的長短與基峰(pitch)位置做特徵段 擷取之分析, 以此特徵段分別求得特徵參數, 其結果大幅降低運算量以及 樣本語音所需記憶空間.在語音辨識過程中, 語音特徵參數選取的優劣對 系統辨識能力相當重要. 中文語音之帶聲段具有類週期的特性, 因此我們 提出一組基於基頻週期的倒頻譜參數, 並結合傳統倒頻譜參數對語音資料 做辨識處理; 在相同發音下, 由於所擷取之特徵段的結構特性很相近, 因 此所得之倒頻譜參數差異性較小, 對辨識能力的提升有不錯的結果.
|