|
本論文提出文字辨識預處理之新觀念,以改善以往線上手寫文字在預 處理程序處理錯誤的情形. 我們都知道預處理是文字辨識所必須的過 程.而預處理包含雜訊處理,筆段抽取,正規化等過程.文字經過預處理之 後,才進入辨識程序,且整個辨識過程是以文字預處理所擷取的文字特徵作 為比對的依據.因此,若能減少預處理錯誤的情形,必能降低文字辨識錯誤 的機率.本文即是針對預處理之筆段抽取及正規化部份進行研究並加以改 善. 於筆段抽取程序,嘗試引進混合型多專家(Mixture of Experts)觀 念,使筆段抽取有兩個專家模組,並使每個專家模組有所分別,使手寫字經 兩專家模組後的結果有所不同,最後依據手寫字的參數,透過決策模組( Gating Network)給予每一專家抽取結果一權重比數(Weighting Factor), 使系統的筆段抽取結果不只一種.並以包含某一基本筆劃的中文字作為實 驗對象,並成功使系統輸出包含兩種不同筆段抽取結果,對於後續比對模組 的辨識正確率勢必有所幫助. 於正規化程序,本文則採用線密度投影 法,將字形非線性正規化,使得字形過長筆劃縮短,使整個字水平分布均勻, 且正規化後的字形較穩定.
|