本論文提出一種新的區域式文字切割方法,解決以不固定字距方式排列及字體大小不 一的中文印刷體字的切割問題。同時考慮被切割文字中有相鄰之重疊字及分裂字等複 雜之切割情形。是以本文提出之文字切割方法具有適應多種切割情況的能力。並可減 少切割錯誤的發生。 一般的文字切割方式僅能處理非常簡單的文字輸入格式。對於複雜的文字輸入格式適 應的能力相當低。這些切割方式對於複雜的輸入情形,一般均採用事先設定輸入格式 的方式來處理。即對於文字排列不固定,字體大小不一等情況,均要事先設定輸入的 格式。對於文件有輕微的傾斜時仍無法處理。而本文所提出的方法則無這些限制,能 自行處理上述情況而達到文字切割自動化之目標。 本研究基本上是採取兩段式的切割方式,先作初步切割,將簡單、可快速處理的字先 行切割出來。接著再找出複雜、需要再處理的對象予以進一步的處理。如此,可以加 快切割文字的速度,節省處理時間。 本文提出的文字切割方法大致上可分為三大部份,分述如下﹕ (1) 初步切割、重疊字及分裂字的尋找﹕利用字間空白間隙及文字行高度作初步切割 ,再利用文字之寬高比例及筆劃交越數等特徵尋找重疊字及分裂字。 (2) 分裂字之合併﹕利用字隙之大小及字之寬高比例合併分裂字。 (3) 重疊字之切割﹕利用本文提出的修正式掃描法預估可能之切割位置,再利用適應 寬度矩形、適應窗及輪廓輪繞法找出正確之切割位置。
|