跳到主要內容

臺灣博碩士論文加值系統

(216.73.216.23) 您好!臺灣時間:2025/10/25 14:27
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:段品任
研究生(外文):Pin-RenDuan
論文名稱:人工智慧於法律的應用 – 死刑與無期徒刑的案件分類
論文名稱(外文):The application of artificial intelligence to the law: The classification of capital punishment and life imprisonment
指導教授:林常青林常青引用關係
指導教授(外文):Chang-Ching Lin
學位類別:碩士
校院名稱:國立成功大學
系所名稱:經濟學系
學門:社會及行為科學學門
學類:經濟學類
論文種類:學術論文
論文出版年:2019
畢業學年度:107
語文別:中文
論文頁數:63
中文關鍵詞:語意空間分群支援向量機死刑無期徒刑判決處理
外文關鍵詞:word2vecthe ClassificationSVMthe death penaltythe life imprisonmentthe processing method of judgement
相關次數:
  • 被引用被引用:6
  • 點閱點閱:653
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:2
本文旨在建立有效分群,找出死刑與無期徒刑差異。藉由差異建立特徵,並輔助法官判決,進而降低犯人從審判到執行的成本。
目前國在法律文件分類上的研究已經相當成熟,多為用特徵詞與 SVM 的搭配進行案件分類。而中文判決的相關分析卻相當少,原因在於中文的處理上並不像英文一樣好處理,且詞性的標記上有許多困難。由於上述困難,使得法律判決在分析上,需要花費大量人力進行處理,進而使得研究上有難度。
本文利用政府資料開放平台所提供的判決書,找出死刑與無期徒刑判決。並以這些判決作為訓練資料,用以訓練 word2vec 建立語意空間。取得判決向量後,利用 K-medians、SVM 對判決進行分群。然而,在實驗過程中發現,判決中無意義資訊過多,使得準確率無法上升。最終,以「本院經查」中的內容做為代表該判決的主要資訊,並進行否定詞的合併,作為 word2vec 的訓練資料。以倍率詞作為特徵詞,提取出判決中較具代表的特徵,作為該判決的語意,並進行分群。
最終使用倍率詞之後,準確率提升為 94%。而實證結果發現,高倍率詞與低倍率詞中,存在一些差異較大的詞彙,像是「喋血」、「不實」、「泯滅」、「枉顧」、「兒童」、「教化」、「遷善」等詞。將其與死刑及無期徒刑的平均向量計算相關性,發現有的詞明顯屬於死刑,而有的詞介於二者中間。然而,死刑與無期徒刑也如預想的,兩者之間十分相近。但是藉由特徵詞,建立出死刑與無期徒刑的差異,使得兩者可被明確區分。
The purpose of this study was to establish an effective classification to find out the difference between Capital punishment and Life imprisonment. Establishing features by difference and assisting judge’s adjudicate, thereby reducing the cost of trial to execution of criminal.
At present, domestic research on the classification of legal documents was quite complete, it was mostly to classify cases by using the characteristic words and SVM. But, it was seldom used to classify Chinese judgments because the processing method of Chinese was different from English, there were many difficulties in marking its part of speech. Due to the above difficulties, bring about the legal judgment analysis required a lot of manpower to process, which made the research difficult. This study make use of the government data open platform to find out the legal judgement of Capital punishment and Life imprisonment. And use it as training data to train word2vec to establish semantic space. After obtaining the decision vector, utilize K-medians and SVM to classify it. However, during the experiment, it was found that there was too much meaningless information in the judgment, which influence the accuracy rate. Ultimately, the main information on the judgment was based on the contents of the find and establishment of the Court , and merged the negative words as training materials for word2vec. Taking rate words as characteristic words, and extract the more representative features of the judgment, and classify it.
Found from empirical results, the death penalty and the life imprisonment, were also as expected, were very similar. However, by using the characteristic words, the differencebetween the death penalty and the life imprisonment was established, so that the two can be clearly distinguished.
摘要 i
英文延伸摘要 ii
誌謝 vi
目錄 vii
圖目錄 ix
表目錄 x
第一章 緒論 1
第一節 研究背景與動機 1
第二節 研究目的 2
第三節 研究貢獻與框架 2
第二章 文獻回顧 4
第一節 我國死刑相關研究 4
第二節 國外文件分類 6
第三節 國內文件分類 7
第四節 文獻總結 7
第三章 研究方法 9
第一節 WECAn斷詞 9
第二節 K-medians 11
第三節 Support Vecter Machine (SVM) 11
第四節 word2vec 13
第五節 word2vec 參數設定 20
第六節 Term Frequency–Inverse Document Frequency (tf-idf) 21
第七節 Word type frequency以及倍率計算方式 21
第四章 資料來源與處理 23
第一節 判決資料來源 23
第二節 初步分析 24
第三節 否定詞處理 25
第四節 法律詞彙 27
第五節 判決內容的擷取 28
一、未進行否定詞處理 --- K-medians 分群結果 28
二、未進行否定詞處理 --- SVM 分群結果 30
三、進行否定詞處理 --- K-medians 分群結果 36
四、進行否定詞處理 --- SVM分群結果 37
第五章 實證結果 44
第一節 未進行否定詞處理 44
一、K-medians 分群結果 44
二、SVM分群結果 45
第二節 進行否定詞處理 47
一、K-medians 分群結果 47
二、SVM分群結果 48
第三節 提取特徵詞 --- tf-idf 50
二、SVM分群結果 51
第四節 提取特徵詞 --- 倍率詞 53
一、K-medians 分群結果 55
二、SVM分群結果 56
第五節 關鍵詞彙 58
第六章 結論 60
第一節 結論與討論 60
第二節 研究限制與未來研究探討 60
參考文獻 62
資料來源 63
中文部份
王兆鵬 (2010),「台灣死刑實證研究」,《月旦法學雜誌》,No.183,105-130。
陳新民 (2007),「廢除死刑暨替代方案之研究」,法務部委託研究報告。
邱垂發 (2018),「重大刑事案件論處死刑之相關法制問題研析」,《國會季刊》,46(3),110-126。
林琬真、郭宗廷、張桐嘉、顏厥安、陳昭如、林守德 (2012),「利用機器學習於中文法律文件之標記、案件分類及量刑預測」,《中文計算語言學期刊》,17(4),49-68。

英文部份
Hachey, B., and Grover, C. (2005), “Sequence Modelling for Sentence Classification in a Legal Summarisation System, ACM Symposium on Applied Computing , 292-296.
Maat de, E., and KRABBEN, K. and WINKELS, R. (2010), “Machine Learning versus Knowledge Based Classification of Legal Texts, The Twenty-Third Annual Conference on Legal Knowledge and Information Systems.
Quaresma, P., and Gonçalves , T. (2005), “Is linguistic information relevant for the classification of legal texts, International conference on Artificial intelligence and law, 10,168-176.
Rong, X. (2005), “Word2vec Parameter Learning Explained, Working paper.
Sulea, O., Zampieri, M., Malmasi, S., Vela,M., , P. Dinu, L., Genabith, J., (2017), “Exploring the Use of Text Classification in the Legal Domain, Working paper.
政府資料開放平台:
https://data.gov.tw/
裁判書用語辭典資料庫查詢系統-名詞查詢 - 司法院:
http://terms.judicial.gov.tw/
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊