大部份的中文音節都包含三個要素一聲母(initial) ,韻母(Final) 和聲調( tone)。雖然中文約有1300個不同的音節,但經歸納,卻只有5個聲調,21個 聲母及39個韻母。因此我們認為將語音中各音節取出,先經切割,再分別辨認各要 素,最後整合各部份的結果,認出音節,並進而認出由音節所組成的詞,是一個較為 可行的大語彙辨認系統模式。本文即是探討其中的聲母辨認問題。 由前人的研究成果及吾人的實際觀察,發現國語語音在頻域上確實含有一些獨有的特 質,因此我們乃定義了9個特徵參數,組成一個9維的特徵向量,希望能有效地鑑別 國語聲母、在實驗中,失但選了617個不同的音節,由三位講者,每人唸兩遍,進 行特定語者的語音辨認實驗。同樣資料測試(closed data test)的平均辨認率為 93.36%,不同樣資料測試(open data test)的辨認率只有67.05%。但 若考慮第二及第三順位(second and third candidates) 的辨認率,則同樣資料測 試的平均正確率可達98.59%,不同樣資料測試,也提高至89.62%。
|