離散隱藏式馬可夫模式必須先以向量量化作前置處理,向量量化是利用集群的技術來 對語音資料作分群的工作,再建立出各群的長,通常是利用此法建立出一個“通用碼 本”。 在本文中提出一種新的方法。用以提高語音辨識率。此種方法介於通用碼本與單語碼 本之間,本文稱之為“半通用碼本”,本方法是先將辨識的單語分成數組,各組各自 建立自己的通用碼本,然后再分別加以訓練。 隱藏式馬可夫模式是屬於機率統計的方法,其辨識法則是采用維持比演算法求出最佳 之機率路徑。故與習知之動態時間扭曲法有祑曲同功之效。但其具有較少記憶空間以 及較少運算量的優點。 本文所提出的“半通用碼本”,有下列之特點: (1) 由於先經過分組以后,再建立各組的碼本,所以可以達到更高的辨識率。 (2) 因為是分組訓練,所以在增加辨識的字匯的時候,無需像傳統的方式,必須重頭 開始訓練。 雖然如此一來會增加一些記憶空間,以及訓練時間,可是這些影響都是很小的,吾人 可以忽略。 在本文中所建立在30個單語的資料庫,對非特定語者之語音辨識。若采用“通用碼本 ”的型式,其教導語句為97.23%的辨識率,測試語句則為94.32%,經本文所提出之“ 半通用碼本”改善后,其教導語句可達98.91%的辨識率,測試語句亦可高達97.02%, 實驗證實,在辨識率上可提高196∼396。
|