跳到主要內容

臺灣博碩士論文加值系統

(18.97.9.170) 您好!臺灣時間:2024/12/03 13:13
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:盧家慶
研究生(外文):Chia-Ching Lu
論文名稱:台灣古契書自動分類與依分類定義契書角色
論文名稱(外文):Automated Classification of Taiwanese Land Deeds
指導教授:項潔項潔引用關係
指導教授(外文):Jieh Hsiang
學位類別:碩士
校院名稱:國立臺灣大學
系所名稱:資訊工程學研究所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2008
畢業學年度:96
語文別:中文
論文頁數:597
中文關鍵詞:臺灣歷史契書分類詮釋資料數位典藏
外文關鍵詞:Taiwan Historyland deedscategorymetadatadigital archives
相關次數:
  • 被引用被引用:7
  • 點閱點閱:690
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:6
台灣古契書是反映民間社會生活的第一手資料,同時也是研究臺灣歷史最重要的第一手資料。蒐集古契書並進行數位典藏除了可以保存契書資料外,也能讓我們透過蒐集的契書資料來瞭解清代臺灣地權轉移與開發史。
由臺灣大學資訊工程所數位典藏與自動推論實驗室和臺灣大學圖書館合作建置的臺灣歷史數位圖書館(Taiwan History Digital Library, THDL)是一個全文數位圖書館,在古契書方面目前已收集由國立台中圖書館及國立台灣大學圖書館所數位化的契書全文共21,399件,其中有21,121件契書具詮釋資料(metadata),其契書來源包括已刊印古契書、臺灣總督府檔案、岸裡大社、新竹北門鄭家、北市文獻會、台大南部古契書等資料群。面對如此龐大的契書資料需要一套好的分類方法讓使用者對整體契書資料能快速地瞭解,並能透過分類有效地使用契書資料。
本研究嘗試利用各數位化單位已經建置完成的詮釋資料來對各古契書資料群進行一致的自動分類。在各資料群詮釋資料中僅有描述契書性質的欄位而沒有精確的分類欄位,且描述性質的標準不一致。我們先參考各專家對古契書建議的分類方法決定了一個初始的分類架構,接著找出各詮釋資料中相當於”契書性質分類”的欄位、搭配每篇古契書的標題,將一篇篇古契書自動對應到上述分類架構中的某一分類。最後為特定分類重新賦予契書關係人物一致的角色。
將前述的自動分類方法與特定分類下角色賦予應用在THDL中21,121件具詮釋資料的契書上,可以將20,698件成功分類,而有423件契書需要經由人工處理分類。同時也發現到在原有14個分類外還可以新增租穀與契尾兩個類別。至於角色賦予由於成果不彰,需重新找尋適合的解決方法,比如說以詮釋資料搭配契書全文的方式。
Before the modernization of land administration by the Japanese during their occupation of Taiwan (between 1895 and 1945), hand-written land deeds are the only proof of the transaction or leasing of land. Land deeds are thus an important source of primary documents for studying Taiwanese society before 1895.
Collaborating with the National Taiwan University Library, the Digital Archives Laboratory of the Department of Computer Science of NTU built a full-text digital library of primary historical documents, the Taiwan History Digital Library (THDL), which includes, among other things, 21,399 land deeds in searchable full-text. We believe that it is the largest data base of its kind in existence. In order to provide a better understanding of the contents and make them easier to use, we attempt, in this thesis, to categorize the collection.
The difficulty arises from the fact that the land deeds in THDL came from different sources. Although most of them (21,121) also contain metadata, they were produced by different people using different standards. Thus, one cannot classify them easily using the descriptions provided in the metadata. We first studied existing classification scheme and chose one, which classified land deeds into 14 categories, that seems most suitable for our purpose. (To simplify the task, we only considered those with metadata.) We then designed an algorithm that, takes each collection, re-classified its content according to the 14 categories.
Our method successfully classified 20,698 of the land deeds. The remaining 423 required examination by experts. We also discovered that two more categories, zugu (租榖) – rental charges in rice, and qiwei (契尾) – official certification for transaction of land, could be added to better capture the nature of the land deeds.
誌謝 I
中文摘要 II
Abstract III
第一章 導論 1
1.1認識臺灣古契書 1
1.2問題定義 2
1.2.1古契書分類 2
1.2.2對每件契書涉入人物賦予一致角色 3
1.3研究目的 4
1.4論文結構 4
第二章 相關契書資料庫網站介紹 5
2.1臺灣歷史數位圖書館(THDL) 5
2.2其他台灣古契書典藏網站 6
2.2.1臺灣大學人類學系人類學藏品資料查詢系統 7
2.2.2國家文化資料庫 7
2.2.3臺大圖書館古契書特藏計畫 8
第三章 本研究採用古契書資料介紹 10
3.1各資料群介紹 11
3.1.1已刊印古契書 11
3.1.2日治時期臺灣總督府檔案 11
3.1.3岸裡大社文書 12
3.1.4臺灣大學南部古契書 12
3.1.5竹塹北門鄭利源號古契書 13
3.1.6臺北市文獻委員會古契書 13
3.2各資料群數位化狀況 14
第四章 研究方法 17
4.1決定一致的分類類別 17
4.1.1目前現行契書分類 17
4.1.2採用的契書分類 19
4.1.3使用的metadata欄位 20
4.2架構[標題-分類對應表] 22
4.2.1初始[標題-分類對應表] 22
4.2.2對其他契書進行重新分類的方法 23
4.2.3透過演算法仍無法處理的契書標題 29
4.3為特定分類的契書中涉入人物賦予角色 31
4.3.1使用的metadata欄位 31
4.3.2現階段特定分類下的角色定義 32
第五章 實驗成果與分析 37
5.1自動分類成果與分析 37
5.1.1國中圖93年 37
5.1.2岸裡大社 39
5.1.3台大圖書館 42
5.1.4統整結果與分析 45
5.2現階段人物角色賦予成果與分析 49
第六章 結論與未來工作 54
6.1結論 54
6.2本研究的限制 55
6.3未來工作 56
6.3.1如何對新metadata進行重新分類 56
6.3.2分類類別的修改與新增 57
6.3.3契書涉入人物角色的一致化 58
6.3.4契書分類與涉入人物角色的運用 59
參考文獻 62
附錄 64
附錄A經4.2.2節步驟2處理的契書標題 64
附錄A-1國中圖93年(共624個契書標題) 64
附錄B經4.2.2節步驟3處理的契書標題 87
附錄B-1國中圖93年(共284個契書標題) 87
附錄B-2岸裡大社(共1個契書標題) 103
附錄B-3台大圖書館(共6個契書標題) 103
附錄C經4.2.3節關鍵詞彙處理的契書標題 104
附錄C-1國中圖93年(共856個契書標題) 104
附錄C-2岸裡大社(共1017個契書標題) 132
附錄C-3台大圖書館(共199個契書標題) 161
附錄D待人工處理分類的契書 168
附錄D-1國中圖93年(共174件契書) 168
附錄D-2岸裡大社(共206件契書) 175
附錄D-3台大圖書館(共43件契書) 186
附錄E其他類的契書 188
附錄E-1國中圖93年(共230件契書) 188
附錄E-2岸裡大社(共34件契書) 195
附錄E-3台大圖書館(共25件契書) 198
附錄F分類成果 199
附錄F-1國中圖93年(共8,602件契書) 199
附錄F-2岸裡大社(共2,610件契書) 457
附錄F-3台大圖書館(共610件契書) 576
[1]國立臺中圖書館與行政院文化建設委員會,國家文化資料庫-臺灣地區古文書資訊網。<http://od.ntl.gov.tw/tl/hdintro.asp> (2008年5月17日)
[2]吳密察、翁佳音、李文良、與林欣宜合著。「臺灣史料集成提要」。台北市:行政院文化建設委員會、遠流出版公司,民國93年,頁101-135。
[3]Szu-Pei Chen, Jieh Hsiang, Hsieh-Chang Tu, Micha Wu: On Building a Full-Text Digital Library of Historical Documents. Asian Digital Libraries. Looking Back 10 Years and Forging New Frontiers: 10th International Conference on Asian Digital Libraries, ICADL 2007, Hanoi, Vietnam, December 10-13, 2007, Proceedings. (Lecture Notes in Computer Science). Springer 2007. 49-60.
[4]杜協昌,古契書全文資料庫(臺大資工數位典藏實驗室)
< http://thdl.csie.org/THDL/RetrieveDocs.php> (2008年5月17日)
[5]國立台灣大學人類學系,ACIS古文書資料庫。<http://140.112.144.1/acis/od/query.asp> (2008年5月17日)
[6]行政院文化建設委員會,國家文化資料庫知識管理系統。<http://km.cca.gov.tw/> (2008年5月19日)
[7]國立台灣大學圖書館與行政院文化建設委員會,台灣大學古契書特藏計畫網站。< http://ci6.lib.ntu.edu.tw:8080/gucci/> (2008年5月19日)
[8]臺灣史料集成編輯委員會編。「臺灣總督府檔案抄錄契約文書」。台北市 : 行政院文化建設委員會、遠流出版公司,民國95年。
[9]張寶三主編、邱婉容與王春香編輯。「臺灣大學圖書館藏珍本東亞文獻目錄-日文臺灣資料篇」。臺北市:臺大出版中心,民國94年,頁888-890、904-909。
[10]洪麗完。「台灣中部平埔族 : 沙轆社與岸�堣j社之硏究」。台北縣板橋市:稻鄉,民國86年,頁253-333。
[11]鄭華生口述、鄭炯輝整理。「新竹鄭利源號典藏古文書」。南投市:臺灣文獻館,民國94年。
[12]王世慶主編、許祖瑛助編。「臺灣公私藏古文書彙編-目錄」。臺北市:環球,民國66年。
[13]台中縣立文化中心,台灣中部平埔族古文書數位典藏。<http://www.tchcc.gov.tw/pingpu/index.htm> (2008年5月22日)
[14]洪麗完。「臺灣中部平埔族古文書研究與導讀-道卡斯族崩山八社與拍瀑拉族四社」。台中縣:台中縣立文化中心,民國91年,頁9-11。
[15]陳雪華、陳昭珍、陳光華。「數位圖書館╱博物館中詮釋資料之理論與實作」。圖書館學刊 第13期(民國87年12月),頁37-60。
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊