本文提出一種以有限狀態向量量化法(Finite state vector quantization techno- logy)為語音辨識系統依據的方法,將其應用於非特定語者之特定語音辨識系統上, 效果良好。 由於習知使用動態特性分析之語音辨識系統其參考型樣所佔用之記億體龐大,辨識速 度較慢,且需要使用時間歸正技術,難以達到大字彙量化及快速化之目的,故本文較 之更具有發展潛力。 本文的研究重點在於以向量量化(Vector quantiztion)之集群技術(Cluster tec- hology)為基礎,結合統針特性,並提出以分佈係數(Span fraction )作為簡易之 判斷法則,可避免相近發音之混淆情形發生,並使傳統式向量量化法具有語音軌跡追 蹤及計憶之功能,由此發展出具有數項優點之語音辨識系統,其具有 ⑴計算量較傳統式向量量化法少。 ⑵無需使用過多的額外記憶體。 ⑶無需時間歸正技術。 ⑷提高辨識率。 ⑸製作簡便,適用於未來大字彙量之語音辨識系統參考型樣之建立。 ⑹記憶體使用量為動態特性法的十分之一。 使用於15句單語時,其辨識率在教導者可達到98.2%,非教導者方面則達到9 5%;在10個數字方面,教導者方面可以達到96.5%,而非教導者可達到92 .6%。
|