跳到主要內容

臺灣博碩士論文加值系統

(216.73.217.60) 您好!臺灣時間:2026/06/17 18:43
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:李振昌
研究生(外文):Jen-Chang Lee
論文名稱:中文文本專有名詞辨識問題之研究
論文名稱(外文):Identification of Proper Nouns in Chinese Texts
指導教授:陳信希陳信希引用關係
指導教授(外文):Hsin-Hsi Chen
學位類別:碩士
校院名稱:國立臺灣大學
系所名稱:資訊工程研究所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:1994
畢業學年度:82
語文別:中文
論文頁數:150
中文關鍵詞:中式人名音譯人名組織名
外文關鍵詞:Chinese surname-nametransliterated person nameorganization name
相關次數:
  • 被引用被引用:9
  • 點閱點閱:303
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:1
現今的自然語言處理中,已經朝向整合法則式與統計式的方向研究,大部
份也有很好的成果,就以中文斷詞系統而言,已經有不錯的成果,但是其
中仍然存在著一些問題,專有名詞的辨識便是其中之一,本論文的目的便
在提出一些策略來解決其中人名與組織名的辨識問題。在眾多專有名詞中
,以人名佔最大宗,所以人名辨識問題是我們首先想解決的問題,其中可
分中式人名與外國人名兩大類,我們分別在第2章與第3章中詳細討論我們
的策略,並且在整個人名辨識中(包含中式人名與音譯人名)得到平
均81.46%的精確率與91.23%的召回率。在專有名詞中,組織名應算是變動
性很大且結構相當複雜的一種,我們在第四章中提出一些策略,嘗試解決
此一棘手的問題,雖然結果並不完美,還有許多尚待改進之處,但是我們
詳細的討論了此種名詞的結構,並解決了其中部份的問題。最後並且列出
所有的實驗數據與測試資料
Current computational model for Nature Language Processing
tends to combine statistics-based model and rule-based model.
It is easy to keep the benefits of both rule-based and
statistics-based language models in such a kind of models. Word
segmentation systems also tend to be implemented in this way.
Although the word segmentation systems are more mature than
before, there also exist an serious problem. Proper noun
identification is a bottle neck and should be resolbed. In
this thesis, we propose models to identify some proper nouns.
The key point is feature assignment. Not only are those proper
nouns identified, but also some special features are assigned.
Chinese surname-names are more than the other proper nouns in
general Chinese texts. We propose a new model to resolve this
problem. By the way, we also assign those proper nouns
features. Transliterated person-names are parts of person-
names in general texts. In the view point of Chinese surname-
name, the structures of transliterated person-names are more
complex. We propose a complete new thinking for resolving this
problem. Based on the structures of proper nouns, we know
organization names are much more complex than the former two.
Sometimes, an organization name may be composed of other proper
nouns, e.g., Chinese surname-names, transliterated person-
names, place names, and so on. In this thesis, we propose a
new model to identify these proper nouns. Finally, we will
demonstrate some examples to explain our approaches and discuss
the experimental results.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top