跳到主要內容

臺灣博碩士論文加值系統

(44.212.96.86) 您好!臺灣時間:2023/12/10 05:16
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:陳昭竹
研究生(外文):Chao-Chu Chen
論文名稱:基於雲端服務架構的漢文缺字處理書籍編輯平台
論文名稱(外文):An editing platform of processing Chinese books missing character base on cloud service
指導教授:鄭武堯鄭武堯引用關係
學位類別:碩士
校院名稱:世新大學
系所名稱:資訊管理學研究所(含碩專班)
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2013
畢業學年度:101
語文別:中文
論文頁數:84
中文關鍵詞:HTML 5WEB FONT缺字處理
外文關鍵詞:HTML 5WEB FONTMissing Character Process
相關次數:
  • 被引用被引用:0
  • 點閱點閱:233
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:1
隨著行動裝置和網路的發展,改變了人們生活的習慣,包括了知識取得及閱讀學習,也加速了電子書及數位閱讀技術的發展,應對這樣的趨勢,由國際數位出版聯盟論壇(International Digital Publishing Forum, IDPF)所推廣EPUB(electronic publication)開放電子書標準已成為各大軟體廠商及出版社的主要發展方向,EPUB可依照不同閱讀裝置、格式、字型樣式而自動排版。未來EPUB3.0更支援了HTML 5的標準,新的規格降低了電子書製作成本及提升使用者更好的閱讀體驗。但對於現行的漢文缺字處理,缺字以圖片為主要顯示的方式,無法讓EPUB自動排版功能產生清晰的字體。
本研究首先分析目前漢文缺字處理在數位化過程中所產生的問題,整合雲端服務的概念及HTML5網頁技術應用提出一套由字型編輯器、網頁內文編輯器而產生的字形動態編碼機制,解決漢文古籍數位化中在網頁輸入、顯示、查詢的缺字問題。此開放式平台的架構能改善漢文古籍數位化轉置的速度,以利於古籍知識的研究及學習。
The development of mobile devices and networks with that changing habits of the people's lives including acquisition of knowledge and learning to read, and accelerate the development of the e-books and digital reading technology to process with this trend. The IDPF (International Digital Publishing Forum) to promote the EPUB (electronic publication) open e-book standard .It has become the main development direction of the major software vendors and publishers. It according to the manufacturing of different reading devices, format and font style automatic layout. The EPUB 3.0 that supports HTML5 standard, the new specifications to reduce the cost of book production and enhance the user reading experience. But for the current Chinese in missing Character processing, missing characters in the picture as the main displayed which can not be let the EPUB automatic layout function produce a clear fonts.
First analyzes the current Chinese language missing word processing problems arising in the digitization process in research and re-integration of cloud computing services concepts and HTML5 web technology applications put forward a set of font editor and web content editor generate character dynamic encoding mechanism. Solve the Chinese language ancient digitized missing words inputting, displaying and searching on the web page. The open platform architecture to improve the speed of the Chinese language ancient books digitization transpose, in order to facilitate the study of the ancient knowledge and learning.
目錄
摘要................................................................................................................................I
Abstract ......................................................................................................................... II
目錄..............................................................................................................................IV
圖目錄..........................................................................................................................VII
表目錄...........................................................................................................................X
第一章緒論..................................................................................................................1
1.1研究動機..................................................................................................................1
1.2研究目的..................................................................................................................1
1.3研究限制..................................................................................................................2
1.4研究流程..................................................................................................................2
第二章文獻分析..................................................................................................................4
2.1中文內碼系統研究..................................................................................................................4
2.2缺字處理研究..................................................................................................................8
2.3漢文古籍數位化..................................................................................................................12
2.4相關技術應用..................................................................................................................14
第三章研究方法..................................................................................................................23
3.1系統規劃..................................................................................................................23
3.2系統需求分析..................................................................................................................25
3.3系統架構..................................................................................................................32
第四章系統開發..................................................................................................................38
4.1功能設計..................................................................................................................38
4.2前端程式開發..................................................................................................................38
4.3後端程式開發..................................................................................................................50
第五章研究結論..................................................................................................................57
5.1實驗結果..................................................................................................................57
5.2研究貢獻..................................................................................................................67
5.3未來發展..................................................................................................................67
文獻參考..................................................................................................................69
圖目次
圖 1:研究流程圖..................................................................................................................3
圖 2:字、字形、字體和字樣的關係.......................................................................................4
圖 3:「為」之異體圖表(二階).............................................................................................6
圖 4:「上」異體字文獻..................................................................................................................7
圖 5:全字庫網站字碼查詢擷取圖.............................................................................................12
圖 6:WINDOWS TRUETYPE造字程式..............................................................................................18
圖 7:WINDOWS造字程式參照視窗說明.............................................................................................19
圖 8:TRUETYPE造字程式造字工具...............................................................................................19
圖 9:TRUETYPE造字程式翻轉/旋轉工具..............................................................................................19
圖 10:ILLUSTRATOR造字功能介面..............................................................................................20
圖 11:TINYMCE編輯器畫面..................................................................................................................21
圖 12:SVG-EDITOR系統畫面..................................................................................................................22
圖 13:數位化工作關係圖..................................................................................................................23
圖 14:開放式數位化編輯平台工作關係圖............................................................................................24
圖 15:平台規劃範疇圖..................................................................................................................25
圖 16:漢文古籍數位化的平台架構--使用者案例..................................................................27
圖 17:檢索字形活動圖..................................................................................................................28
圖 18:造字編輯器活動圖..................................................................................................29
圖 19:書籍檔案維護活動圖..................................................................................................................30
圖 20:內文編輯器活動圖..................................................................................................................31
圖 21:內文檢視活動圖..................................................................................................................32
圖 22:平台系統MVC架構圖.............................................................................................................33
圖 23:APACHE.BATIK套件應用的類別圖..........................................................................................35
圖 24:GOOGLE.GSON應用的類別圖.................................................................................36
圖 25:JSOUP.ORG應用的類別圖.............................................................................36
圖 26:APACHE.COMMONS應用的類別圖........................................................................36
圖 27:APACHE.LOG4J 應用的類別圖...............................................................................37
圖 28:書籍章節資料維護主頁功能說明...........................................................................39
圖 29:章節訊息視窗功能說明......................................................................................................40
圖 30:內文編輯器主頁功能說明..............................................................................41
圖 31:預覽視窗功能說明.................................................................................................42
圖 32:缺字輸入內文說明........................................................................43
圖 33:造字編輯器功能說明....................................................................................44
圖 34:造字步驟1視窗功能說明..............................................................................45
圖 35:造字步驟2視窗功能說明..................................................................................45
圖 36:造字步驟3視窗功能說明.......................................................................................................46
圖 37:部件輸入視窗.......................................................................................................46
圖 38:書籍查詢分頁功能說明......................................................................................................47
圖 39:缺字內文索引分頁功能說明......................................................................................................48
圖 40:部首內文索引分頁功能說明.........................................................................................................48
圖 41:字體資訊明細主頁........................................................................................................49
圖 42:缺字內文查詢清單功能說明................................................................................50
圖 43:預覽介面功能說明..............................................................................................50
圖 44:文字排版學說明......................................................................................................51
圖 45:編輯原始HTML檔案................................................................................................52
圖 46:檢視HTML檔案...............................................................................................53
圖 47:SVG FONT格式檔案...............................................................................................53
圖 48:平台字形格式支援.................................................................................................53
圖 49:系統座標差異說明..................................................................................................55
圖 50:拆解字形部件........................................................................................................60
圖 51:平台編輯結果(紅字為造字字形,本文為標楷體).........................................................62
圖 52:中央研究院缺字系統DEMO資料-網頁截圖.............................................................62
圖 53:中央研究院缺字系統DEMO資料-放大顯示..............................................................................63
圖 54:本研究平台編輯結果..................................................................................................64
圖 55:本研究平台編輯結果(放大顯示)................................................................................64
圖 56:平台西夏文字檢視結果(字義為:一二三四五)........................................................................65
圖 57:「山」異體字查詢.................................................................................................65
圖 58:「山」異體字輸入..........................................................................66
圖 59:「山」異體字顯示...............................................................................................66
表目次
表1:異體字說明案例..................................................................................................................6
表2:UNICODE正、俗字字體範例....................................................................................7
表3:構字符號..................................................................................................................9
表4:構字式範例說明..................................................................................................................10
表5:本研究平台功能說明表..................................................................................................................25
表6:套件功能說明表..................................................................................................................34
表7:路徑命令資料說明..................................................................................................................54
表8:自定<WORD>標籤屬性說明(*為必要屬性).......................................................................55
表9:造字程式功能差異表..................................................................................................................57
表10:編碼方式優缺點比較表..................................................................................................................59
表11:大正藏內文缺字問題測試.........................................................................................60
表12:本研究造字編輯器造字結果..........................................................................................60
表13:頂尊勝陀羅尼經文缺字顯示.........................................................................................61
表14:平台造字結果..................................................................................................................61
表15:平台造字結果..................................................................................................................63
表16:西夏文造字測試..................................................................................................................64
[1]Batik SVG Toolkit Project;http://xmlgraphics.apache.org/batik/;Retrieved:2011/10/01
[2]EPUB 3 Changes from EPUB 2.0.1;http://idpf.org/epub/30/spec/epub30-changes.HTML;Retrieved:2011/10/20
[3]EPUB Content Documents 3.0; http://idpf.org/epub/30/spec/epub30-contentdocs.HTML;Retrieved:2011/10/20
[4]Findmebyip.com;http://www.findmebyip.com/ ;Retrieved:2011/09/30
[5]HTML5Test;http://www.HTML5test.com/;Retrieved:2011/09/30
[6]IDPF,http://www.idpf.org/about.htm:Retrieved: 2011/07/10
[7]IFLA - The International Federation of Library Associations and Institutions ;http://www.ifla.org/;Retrieved:2011/10/20
[8]Mark Pilgrim;HTML 5 Up and Runing;O'Reilly Media;2010
[9]Omniglot.com ;http://www.omniglot.com/writing/tangut.htm;Retrieved:2012/01/10
[10]Roadmaps to Unicode;http://www.unicode.org/roadmaps/bmp/;Retrieved:2011/09/10
[11]SVG - Editor;http://code.google.com/p/svg-edit/;Retrieved:2012/07/01
[12]TinyMce;http://www.tinymce.com/;Retrieved:2012/07/01
[13]TEI ;http://www.tei-c.org/index.xml;Retrieved:2011/10/01
[14]The NIST Definition of Cloud Computing;http://csrc.nist.gov/publications/nistpubs/800-145/SP800-145.pdf ;Retrieved:2011/10/01
[15]W3C–HTML5 specification;http://www.w3.org/TR/HTML5/;Retrieved:2011/09/20
[16]W3C–HTML5 differences from HTML4;http://www.w3.org/TR/HTML5-diff/; Retrieved:2011/09/20
[17]W3C–SVG;http://www.w3.org/Graphics/SVG ;Retrieved:2011/07/21
[18]W3C–FONTS;http:// http://www.w3.org/Fonts/ ; Retrieved:2011/08/30
[19]Wikipedia–Cloud Computing;http://en.wikipedia.org/wiki/Cloud_computing;Retrieved:2011/07/20
[20]Wikipedia–Metadata;http://en.wikipedia.org/wiki/Metadata;Retrieved:2011/10/01
[21]ADOBE ILLUSTRATOR 使用手冊, http://www.adobe.com/support/documentation/archived_content/tw/illustrator/cs3/illustrator_cs3_help.pdf;取得日期:2012/12/30
[22]CNS11643中文全字庫, http://www.cns11643.gov.tw/;取得日期:2011/9/12
[23]CNS11643軟體操作使用手冊下載網址;http://www.cns11643.gov.tw/AIDB/download.do:取得日期:2011/9/12
[24]mozilla.org–SVG;https://developer.mozilla.org/zh_tw/SVG;取得日期:2011/9/10
[25]中央研究院缺字系統;http://char.iis.sinica.edu.tw/;取得日期:2012/01/07
[26]中央研究院-國際電腦漢字及異體字知識庫網站;http://chardb.iis.sinica.edu.tw/;取得日期:2011/10/21
[27]中文電腦缺字解決方案 - 漢字構形資料庫使用手冊;http://cdp.sinica.edu.tw/service/documents/manual.pdf;取得日期:2011/9/10
[28]中華電子佛典協會;http://www.cbeta.org/;取得日期:2012/09/02
[29]世新大學-數位典藏學習網;http://ic.shu.edu.tw/DA/DADL/Index.htm;取得日期:2011/10/01
[30]林瑩娟;漢語異體字整理法研究;雲林;國立雲林科技大學;2006年
[31]數位典藏與數位學習計畫百科-中文缺字技術;http://wiki.teldap.tw/index.php/中文缺字技術;取得日期:2011/9/13
[32]吳政泓,可攜式文字集之研究與應用;台北;國立台灣大學資訊工程研究所碩士論文;2004年
[33]建立Unicode漢字異體字表與異體字辭典相關研究; http://www2.ndap.org.tw/newsletter06/news/read_news.php?nid=217;取得日期:2011/11
[34]洪進財;〈SVG網頁程式設計實務〉;台北;文魁;2008年
[35]袁國華、林正偉、詹今慧、趙苑夙;《Unicode 電腦漢字異體字字典》編纂過程所遭遇的困難和解決方案;第二十屆中國文字學國際學術研討會論文集;中山大學;P:533-561;2009年
[36]袁語祺;數位典藏與後設資料應用於電子書之研究;台北;私立世新大學資訊新聞傳播學院碩士論文;2010年
[37]教育部–異體字字典;http://dict.variants.moe.edu.tw;上網取得日:2011/07/07
[38]莊德明;漢字數位化的困境及因應:談如何建立漢字構形資料庫; http://cdp.sinica.edu.tw/service/documents/T960507.pdf;取得日期:2011/07/02
[39]莊德明;中文電腦缺字解決方案;http://linguistics.berkeley.edu/~rscook/pdf/CDM-HanziMissingChar.pdf;取得日期:2011/09/15
[40]莊德明;構字式的處理技巧;http://cdp.sinica.edu.tw/service/documents/T960419.pdf;取得日期:2011/09/16
[41]陳明秀;歷史性報紙新聞數位典藏保存與呈現介面之研究;台北;私立世新大學資訊傳播學系碩士論文;2008年
[42]陳雪華, Metadata 在電子圖書館所扮演的角色, 國立成功大學圖書館館刊;Vol:3;P:16-24;1999
[43]雲端運算使用案例討論小組(2010),雲端運算使用案例白皮書(第三版);http://opencloudmanifesto.org/Cloud_Computing_Use_Cases_Whitepaper-3_0-China_T.Chinese_translation.pdf;取得日期:2011/11/01
[44]維基百科–HTML5 ;http://zh.wikipedia.org/wiki/HTML5;上網取得日期: 2011/07/16
[45]維基百科–Web開放字型格式;http://zh.wikipedia.org/wiki/開放字型格式;取得日期:2011/09/10
[46]維基百科–首頁;http://wikipedia.tw/;上網取得日期:2011/07/10
[47]維基百科–基本多文種平面;http://zh.wikipedia.org/wiki/基本多文種平面;取得日期:2011/09/10
[48]謝清俊;電子古籍中的缺字問題;http://cdp.sinica.edu.tw/cdphanzi/documents/T850825.pdf;取得日期:2011/09/15
[49]顧力仁;資訊時代圖書館中國古籍組織與利用之探討;台北;國立台灣大學圖書資訊系博士論文;2001年
[50]顧力仁;數位圖書館與古籍整理之探討;圖書資訊學刊;臺灣大學;Vol:14;P:115-127;1999年
[51]范紀文、何建明、李德財;從典藏資料交換角度探討Metadata 設計與標準化問題;新世紀數位圖書館與數位博物館趨勢研討會;新竹市:交通大學圖書館;2001年
[52]曾敏玲,非書的書─電子書,http://www.scu.edu.tw/library/pub/s14/14-1.pdf,取得日期:2011/07/01
[53]曾開昱;可攜式字集資源的缺字呈現與輸入問題;台北;國立台灣大學資訊工程研究所碩士論文;2006年
[54]蔡永橙、黃國倫、邱志義;〈數位典藏技術導論〉;台北:國立臺灣大學出版中心;ch1- 4;2007年
[55]謝育平、項潔;可攜式文字資源--用以解決中文的缺字問題;http://datf.iis.sinica.edu.tw/Papers/2004datfpapers/2/2.pdf;取得日期: 2004/10/27
電子全文 電子全文(本篇電子全文限研究生所屬學校校內系統及IP範圍內開放)
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top