本論文主要的目的是找一種又快又準的方法去辨認中文印刷體文字(包含5401個字 )。這方法最主要有二個步驟:首先對每一個中文字做特徵淬取(feature extrac- tion) ,其淬取方法有4種。即交接筆劃數、字形週邊線長、周邊面積和連結素子 ,交接筆劃數是將字形以左右、上下二種方向掃描找出每一行列中交接的筆劃數, 字形週邊線長則是將字形以左右、上下二種方向掃描至第一筆劃為止,然候算出每 二行列中的差,周邊面積是將字形以左右、上下二種方法掃描至第一筆劃為止,然 候算出每一行列中的面積,連結素子就是算出每一字形細線化後產生的形式,其次 使用簡單的貝氏法則(Bayes decision rule) 做分類,我們的辨認方法簡單、正確 及省時,它的正確性可達 99.71﹪。
|