本論文提出以層狀神經網路(layered neural network)作國語塞音(/ㄅ/,/ㄉ /,/ㄍ/及/ㄆ/,/ㄊ/,/ㄎ/)辨認之研究。網路中之隱藏式神經元個數及 網路參數均加以變化以便探討其對辨認率之影響。 在固定語境(後接元音/ㄚ/)的情形下,其辨認率為94%,而同樣的資料,採用 貝式分類法(Bayes classifier)可得95%,兩者極為接近。若以受測者之少量語 音資料來調整神經網路之參數,則辨認率可達96.8%。在多種語境(後接元音/ ㄚ/,/ㄧ/,/ㄨ/)的實驗中,神經網路之辨認率可達94%,優於使用貝氏分 類法所得到的90.2%辨認率。這是因為傳統統計分類法通常需事先假設語音特徵 向量(feature vector)之分布狀況,而神經網路並不需假設語音特徵向量之分布狀 況。貝氏分類法將特徵向量之分布假設為聯合常態分布(joint normal distributi- on),在多種語境下並不盡理想,而神經網路經由訓練過程,可將特徵空間(featu- re space)自動作最佳或次佳分割,這是其優於貝氏分類法的主要原因。 為探討神經網路之強韌性或容錯能力,我們將網路中任意去掉一個隱藏式神經元,再 與原來網路之辨認率比較。實驗顯示隱藏式神經元的數量愈多,少掉一個隱藏式神經 元的影響愈小。這証明神經網路可將資訊平均分攤到每個隱藏式神經元。最後,我們 提出一個方法可減少隱藏式神經元個數,但保持資訊量損失在最小的程度。這是將被 去掉之神經元的貢獻,轉移至其餘的神經元上。實驗顯示作這種轉移後,少掉一個隱 藏式神經元的影響非常微小。這証明我們提出的方法相當成功。
|