跳到主要內容

臺灣博碩士論文加值系統

(44.201.92.114) 您好!臺灣時間:2023/03/31 08:48
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:黃小閑
研究生(外文):Siao-sian Huang
論文名稱:司法案例資訊檢索之研究
論文名稱(外文):The Study of Judicial Case Information Retrieval
指導教授:邱登裕邱登裕引用關係
指導教授(外文):Deng-yiv Chiu
學位類別:碩士
校院名稱:中華大學
系所名稱:資訊管理學系
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2005
畢業學年度:93
語文別:中文
論文頁數:73
中文關鍵詞:文章分群特徵摘要
外文關鍵詞:Document ClusteringDocument Summarization
相關次數:
  • 被引用被引用:0
  • 點閱點閱:496
  • 評分評分:
  • 下載下載:24
  • 收藏至我的研究室書目清單書目收藏:0
摘 要
在這資訊過載的時代,想要從龐大的資料量中尋找出所需之相關資訊是相當不易。目前使用者在搜尋相關資訊時,所遇到最大的兩個問題:(1)使用者無法明確的表達出自己的需求,提出精確的查詢問句,(2)使用者要從龐大的資料中找出自己想要的資訊,是相當消耗人力且費時。因此,本研究針對這兩個問題提出解決辦法,利用相似度計算的方式將文章群集化,並以文章特徵摘要的技術解決使用者在這方面的困擾。本研究藉由文章與文章之間的相似度計算,將相似性較高的文章建置於同一群集內,以減少使用者在搜尋相關資訊時所浪費的人力資源,並且於短時間內得到更多的相關資訊。再則,利用關鍵字比對的方式,擷取文章內容之重要段落做為特徵摘要,以找出可以充分的表達文章含意之特徵摘要,讓使用者明確的了解文章的意義。
Abstract
Due to the mass of information, it is difficult to find desired information. The research indicates two main problems in information retrieval: first, users can’t express what information they need and can not perform specific query. Secondly, to manually obtain desired information in the huge amount of information is time-consuming. Document clustering technique base on document similarity and document summarization are used to solve the problems in the research. The document clustering process is used to group similar documents in one cluster to reduce the time of manually searching and to enrich the content. By searching the keywords, the summary of documents is extracted. The summary sufficiently represents the meaning of the documents, which greatly aids users in understanding the documents.
中文摘要..............................................i
英文摘要..............................................ii
誌 謝..............................................iii
目 錄..............................................iv
表 目 錄..............................................vi
圖 目 錄..............................................vii
第壹章 緒論.........................................1
第一節 研究背景......................................1
第二節 問題定義......................................2
第三節 主要挑戰......................................2
第四節 論文架構......................................3
第貳章 文獻探討......................................5
第一節 文件探勘......................................5
第二節 自動摘要......................................6
第三節 相似度計算之相關研究............................9
第四節 相似度計算....................................10
第五節 文章分類器....................................11
第六節 資訊檢索......................................15
第參章 研究架構與方法.................................17
第一節 系統架構 .....................................17
第二節 前置處理模組...................................19
第三節 特徵摘要模組...................................23
第四節 文章分群模組...................................25
第五節 資訊檢索系統模組................................28
第肆章 實驗結果與分析.................................31
第一節 資料來源與驗證方法 .............................31
第二節 實驗結果......................................32
第伍章 結論與後續發展.................................46
第一節 研究結論......................................46
第二節 研究限制......................................48
第三節 後續發展與建議.................................49
參考文獻..............................................51
附錄一 向量空間模組範例...............................54
附錄二 機率模組範例...................................57
附錄三 向量基底關鍵字.................................59
附錄四 文章相似度.....................................63
附錄五 資訊檢索系統之查詢語句..........................73
中文部份
1.林厚誼 (民 89),犯罪手法及失贓證物相似之竊盜犯罪案件資訊檢索,東海大學資訊科學研究所碩士論文。
2.吳仕先 (民 91),文件資料之概念主題檢索,元智大學資訊工程學系碩士論文。
3.胡俊彥 (民 92),以代理人為基礎之客服電子郵件自動回覆系統,交通大學碩士資訊管理研究所論文。
4.陳盈如(民 93),稅務法規問答系統之研究,銘傳大學資訊管理研究所碩士論文。
5.彭怡菁(民 90),以統計量測為基礎之交易資料集分群,台灣大學資訊工程學系碩士論文。
6.葉鎮源(民 90),文件自動化摘要方法之研究及其在中文文件的應用,交通大學資訊科學系碩士論文。
7.顏義樺 (民 92),以聯想法則概念網路為基礎之文章概念探索及相似性比對,東海大學資訊工程與科學研究所碩士論文。
8.蕭淑玲 & 周世俊 (民 92),運用文件探勘於語料庫之辦公室服務代理人,電子商務學報,第5卷第1期。
英文部份
1.Barzilay & Elhadad(1997). R. Barzilay; M. Elhadad, “Using Lexical Chains for Text Summarization”, Proc. of Intelligent Scalable Text Summarization Workshop (ISTS'97).
2.Berry & Linoff(2001). M. J. A. Berry; G. Linoff, “Data Mining Techniques : for Marketing, Sales, and Customer Support”, Wiley Publishing Co.,Ltd1.
3.Bruza et al.(2000). P. Bruza; R. McArthur; S. Dennis, “Interactive Internet Search: Keyword, Directory and Query Reformulation Mechanisms Compared”, Proceedings of ACM SIGIR.
4.IBM( 2001).IBM, “Reading between the Lines- Mining Unstructured Data”, Senior Consultant, Knowledge Discovery Consulting Group.
5.Lam & Ho(1998). W. Lam; C. Y. Ho, “Using a Generalized Instance Set for Automatic Text Categorization”, Proceedings of SIGIR.
6.Larkey & Croft(1996). L. S. Larkey; W. B. Croft, “Combining Classifiers in Text Categorization”, Proceedings of SIGIR.
7.Kupiec et al.(1995). J. Kupiec; J. Pedersen; F. Chen, “ A Trainable Document Summarizer”, Proc. of ACM SIGIR.
8.Mani & Maybury(1999). I. Mani; M. T. Maybury, “Advances in Automatic Text Summarization”, MIT Press.
9.Salton et al.(1997). G. Salton; A. Singhal; M. Mitra; C. Buckley, “Automatic Text Structuring and Summarization ”, Information Processing & Management.
10.Salton et al.(1975). G. Salton; A. Singhal; M. Mitra; C. Buckley, “A Vector Space Model for Automatic Indexing”, Communications of the ACM.
11.Schapire et al. (1998). R. E. Schapire; Y. Singer; A. Singhal, “Boosting and Rocchio Applied to Text Filtering”, Proceedings of SIGIR.
12.Sullivan(2001). D. Sullivan “Document Warehousing and Text Mining: Techniques for Improving Business Operations, Marketing, and Sales”, Wiley Publishing Co., Ltd.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top