論文名稱(外文):A text recognition system based on OCR
指導教授(外文):HUANG, KO-WEI
外文關鍵詞:Image processingOptical Character RecognitionObject Detection
掃瞄儀器 越來越大眾化的情況下,我們可以看到
越來越多的圖像辨識技術以及光學字元辨識之技術 漸漸地 與我們的生活密不可
分。光學字元辨識, 一種文字自動輸入的方法, 顧名思義就是以手機或者相機等
電子設備拍 下所需要辨識的辨識之圖片後,透過偵測 光線 亮與暗的方式來決定字
的外型,再利用光學字元辨識的技術將其轉換為需要辨識之文字的 過程。 可 簡易
分成三個部分 : 1.影像掃描器 2.光學字元辨識軟體 3.輸出介面,先透過影像掃描
器將輸入之影像掃描過後 並且將圖片有損毀的部分先做影像前處理 接著 將其 處
理結果 輸入光學字元辨識軟體辨識,再將辨識結果轉換成特定文件類型 (PDF
WORD…等 再 轉交由輸出介面顯示出結果或者儲存到特定位置 。 本論文為了
有效的增加辨識率, 結合影像辨識及光學字元技術 主要為提高中文辨識率,透
影像處理 、光學字元識別、物體偵測。
With the develop of the technology and the scanning instrument becoming more popularization. We know the Image Recognition Technology and Optical Character Recognition inseparable from our lives gradually. Optical Character Recognition is a method of automatic input word, after we use the cellphone or camera to take the pictures that needed to recognize, Determine the shape of the word by detecting light and dark, and the process if using Optical Character Recongnition technology to convert it into word that needed to be recognized. We can simply divided into three parts :1.Image scanner 2. Optical Character Recognition software 3. Output interface , After scanning the input image through an image scanner and pre-processing the damaged part of the image, then input the processing result into the Optical Character Recognition software for recognition , and then convert the recognition result into a specifi file type(PDF , WORD…).and then forward the result to the output interface or save it to a specific location.In order to effectively increase the recognition rate,this paper combines image recognition and Optical Character Recognition technology, mainly to improve the Chinese recognition rate.Through the experimental results, it can be seen that the research method proposed in this paper can effectively recognize Chinese characters in images.
摘要 i
Abstract ii
誌謝 iii
目錄 v
表目錄 vii
圖目錄 viii
1、緒論 1
1.1研究背景 1
1.2研究動機與目的 2
1.3論文架構 3
2、文獻回顧 4
2.1光學字元識別 4
2.2影像前處理 5
2.2.1灰階化 6
2.2.2平均濾波 6
2.2.3邊緣偵測[11][16] 7
2.2.1二值化[7] 9
2.2.2梯度運算 11
3、研究方法 12
3.1本實驗之系統流程圖介紹 13
3.1.1選取圖像、路徑、以及數入圖像 13
3.1.2影像灰階化、平均濾波、利用LAPLACIAN尋找邊緣 14
3.1.3尋找字體輪廓、圈選ROI 14
3.1.4進行文字識別、輸出 16
3.2廣告圖之字元識別系統 17
3.2.1影像前處理技術 17
3.2.2梯度運算 21
3.2.3尋找輪廓,圈選ROI[20] 22
3.2.4字元識別 23
4、研究結果與分析 24
4.1系統之前置測試的研究結果與分析 24
4.2系統的研究結果 33
5、結論與未來展望 35
6、參考文獻 36

