文字辨認是人工智慧及樣形識別中的一個是目.雖然,它是一個很難的題 目;但同時,它亦是一個很有趣及有用的題目.在我們這個世界之中充滿 了許多使用到文字辨認的事情,例如:郵政地址區別,文件翻譯,銀行中 的卬章鑑定等.其中都或多或少的用到了文字辨認的技巧,若果我們可以 開發一些能應用於上述情況的文字;辨認系統,則可提高整體的生產力. 在辨認卬刷體的文字方面的技術,已經發展至接近成熟階段,市面上亦可 看到許多這方面的產品.但在處理手寫中文的辨認系統方面,則暫時仍只 是在起步階段而已.文字辨認系統的困難在於,人類本身自己也不完全明 白人類是如何辨認所見到的文字.因以,在解決文字辨認方面的問題時, 不能用解決數學或邏輯問題時所用的方法--設計〞演算法〞( algorithm) 來解決所遇到的問題,因為我們並不知道辨認文字的〞演算 法〞.一般我們用在文字辨認的方法有三種.第一為統計法,假定可以用 一些機率分佈函數來表示不同的字,借由訓練樣本中求得函數的參數;如 常態分佈中的〞mean”與”variance”.然後在辨認時求取辨認樣本屬於 不同字的機率,取最大的機率所屬的字類為分辨的類.第二為結構法,主 要用於on-line 系統,以文字的結構特徵為主,如文字的筆劃數,筆劃之 間的角度關係等.以後發展一套〞文法〞來表示不同的字,如:只有二筆 ,而二筆間之角度接近180度,則為〞二〞字.第三種為類神經網路法 ,借為數學模型,模擬人類大腦的結構,使之具有人類在處理抽像資料的 能力.這也是本篇論文所使用的方法.本篇論文所處理的文字是以低解析 度的off-line輸入圖形為主.由於電腦在處理低解析度的影像時有較佳的 效率,如圖文分割,影像前處理等.因此,如果電腦能有效的辨認低解析 度文字,則可提高系統的效能.本文所建議的系統架構能有效的辨認低解 析度文字,雖然系統現時所能辨認的字數只有六十三字,但可借由更改系 統所使的類神經網路的增加辨認字數,而這也是一值得再深入探討的課題 .
|