近年來,多媒體系統已經成為很受歡迎的計算機系統。它不但提供各種不同的媒體資 訊,例如,聲音、影像、圖形和文字。而且能夠將這些資訊結合在同一書面底下,並 且有修改的功能。文件則是目前資訊傳遞的主要媒介,因此如何將舊有文件轉換成多 媒體系統可利用的資料就成為一個迫切需要的問題。 本篇論文提出一個多媒體文件的處理系統。這個系統包含三個模組,歪斜角度校正模 組(skew angle correction) 、區塊分隔模組(block segmentation)和區塊辨認模組 (block recognition) 。歪斜角度校正模組是將由影像掃瞄器輸入的文件,假如產生 歪斜情形時,利用程式自動校正。基本上是利用文件左緣文字會在同一條直線的特性 ,利用霍氏轉換(Hough transform) ,求出歪斜角度。區塊分隔模組將文件分成數個 區塊,每個區塊包含相同性質的資料。我們利用一個以線段(segment) 為基礎的演算 法,在執行時可結省大量的記憶體空間。區塊辨認模組利用每個區塊的灰度剖面圖 ( profile)找出它們之間不同的特性,利用這些特性將區塊分成標題、文字、影像、圖 形或分隔線。 我們以數張文件作測試,經過分離及辨認的實驗結果令人滿意。
|