在本論文中,使用EAT語料庫中的麥克風語料,並參考CMU字典將音檔內容的單字標記轉換成音素標記,考慮前後文之間的相關性,建立以三聯音素為單位的隱藏式馬可夫模型,並以狀態為分享單位,用決策樹決定模型參數的共享。接著使用紐約時報(New York Times)當作語言模型的訓練語料,分別建立bigram與trigram語言模型,並對語言模型進行適當的調適,最後將調適過的語言模型加入到基本英語辨識系統中進行測試語料辨認,並比較使用語言模型前後辨識率的差異以及探討提升原因。使用本論文所建立的聲學模型進行音素辨識,可獲得49.75%的辨識率;進行單字辨識,未加入語言模型時,短句辨識率為35.52%,詞組辨識率為56.31%;加入bigram語言模型後,短句與詞組辨識率分別為56.14%與56.79%;加入triigram語言模型後,短句與詞組辨識率分別為60.23%與57.48%,由結果可看出語言模型幫助系統辨識率提升不少。
|