本論文提出一種對國語連續語音中聲調辨認的方法。起先,輸入語音中的每一個音節 由音高和音強兩種訊息定出其位置,然後,從每一音節的有聲部份抽取出兩種聲調特 徵,一是音高,二是音高軌跡的斜率。取樣出這兩種特徵,音高軌跡於是轉換成一序 列的特徵向量。運用向量量化(Vector Quantizaition)和隱藏式馬可夫模式(Hid- den Markov Modeling) 的技術建立一套語者無關(Speaker Independent) 的國語 四聲辨認系統。 實驗中,單字、雙字詞和三字詞對共三組字彙集被用來當作測試語料。當使用單字字 彙集建立的四個模式,每一個聲調建立一個,對單字、雙字詞和三字詞作聲調辦認, 分別得到98.38%,87.92%,與76.49的正確率。假使連續語音的聲 調變化與前後發音相關性(Coarticulation)考慮在內,最好每一個聲調建立多個模 式。對於每一個聲調建立三個模式,總共12個模式的實驗顯示:雙字詞與三字詞的 正確率分別改善為93.28%與78.26%,而單字的正確率為97.69%, 由於聲調變化與前後發音相關性引起辨認正確率的降低原因同時被探討。
|