跳到主要內容

臺灣博碩士論文加值系統

(44.192.79.149) 您好!臺灣時間:2023/06/10 03:30
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:陳光華
研究生(外文):Kuang-hua Chen
論文名稱:語彙知識之擷取與混合式機器翻譯系統之研究
論文名稱(外文):A Study on Acquisition of Lexical Knowledge and A Hybrid Machine Translation System
指導教授:陳信希陳信希引用關係
指導教授(外文):Hsin-Hsi Chen
學位類別:博士
校院名稱:國立臺灣大學
系所名稱:資訊工程研究所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:1996
畢業學年度:84
語文別:中文
論文頁數:220
中文關鍵詞:機器翻譯語彙知識文本分析雙語對列演算法自然語言處理
外文關鍵詞:machine translationlexical knowledgetext analysisalignment
相關次數:
  • 被引用被引用:2
  • 點閱點閱:338
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:4
藉由完全了解文句而從事翻譯,到目前為止,機器還做不到,我們採用另
外一種方式來處理。首先,輸入的文句經由部分剖析器切成一段一段的,
接著我們從這一段段的文字決定可能的述語參數結構,這兩部份組成分析
模組 (Analysis Module)。轉換模組則負責詞彙選擇及結構轉換,詞彙選
擇的演算法是根據詞與詞之間的交互限制以決定正確的詞彙,而結構轉換
則根據分析模組所決定的述語參數結構以從事轉換。合成模組根據以上兩
個模組所做的結果,產生正確的譯文,而譯文的詞序則植基於馬可夫模
型 (Markov Model)。而整個翻譯模型所需要的知識是由各個單語語料庫
或是語言學理論得到,如此轉換模組的負擔得以減輕,而翻譯模型也較容
易擴展至其它語言組合。因應此混合式機器翻譯系統,我們也提出由大量
語料庫擷取語言知識的新方法,以避免因人力之介入,所造成語言知識不
一致的情形。此方法首先應用部分剖析器剖析語料庫,降低語料的複雜度
,再用些簡單的規則或已有的知識以擷取更多的知識。我們已成功地運用
此方法從語料庫擷取名詞片語、述語參數結構及形容詞的分類架構。最後
,我們提出兩種分析語料庫的工具:文本分析及文句對列,為爾後機器翻
譯系統及語言知識之擷取提供更進一步的幫助。目前實用的機器翻譯系統
皆是應用於特殊範疇(Category),另外照應詞(Anaphora)常對機器翻譯系
統造成困擾,而文本分析對文本範疇之判定及照應詞之選擇具有相當的幫
助。文句對列則能決定雙語語料庫的對譯句子,對於日後用於訓練翻譯模
組之對譯案例的擷取有重要的幫助。
In this dissertation, a new approach is proposed to extract
lexical knowledge from large text corpora. This approach not
only avoid human cost in compiling knowledge, but also gets rid
of inconsistency introduced by human. It first partially
parses text corpora, and then uses simple rules or existing
knowledge to build more useful lexical knowledge. We have used
this approach to extract noun phrases, acquire predicate-
argument structures and classify adjectives. A new model for
machine translation system is also proposed. This model
integrates the qualitative and the quantitative viewpoints to
machine translation systems. Not only does it reduce the
computation time in processing long sentences, but also it
utilizes the lexical knowledge extracted from large corpora.
The model also consists of three components: analysis, transfer
and synthesis, but they have different mechanisms from the
traditional transfer based translation system. The analysis
module is a shallow parser - a probabilistic chunker. In
addition, to extract the indispensable knowledge from input
sentence for enhancing the translation quality, two knowledge
extractors are proposed. The first extractor is used to
acquire noun phrases in input sentences. The second extractor
is to determine the predicate argument structures in the input
sentences. In order to augment the performance of MT system,
some tools are also proposed. A sentence alignment based on
content tags is proved to be very useful in aligning sentence.
Applying such tool will do the good for the acquisition
bilingual lexical knowledge. Besides, a topic identification
algorithm is invented not only for anaphora resolution, but
also for text domain identification.
封面
中文摘要
英文摘要
誌謝
簡歷
著作
目錄
圖錄
表錄
1.緒論
1.1 歷史回顧
1.2 語彙知識的擷取
1.3 本論文的結構與目標
2.機率式文句分段器
2.1 前言
2.2 語言模型
2.3 實驗程序
2.4 結論
3.名詞組與述語參數結構的擷取
3.1 前言
3.2 名詞組的擷取
3.3 述語參數結構的擷取
3.4 討論與摘要
4.混合式機器翻譯架構
4.1 各種機器翻譯架構
4.2 我們的策略
5.轉換模組
5.1 前言
5.2 述語參數結構的轉換
5.3 詞彙轉換
5.4 我們的策略
5.5 語料的蒐集與實驗結果
5.6 討論與摘要
6.合成模組
6.1 字詞排序
6.2 新的合成模組
6.3 實驗及結果分析
6.4 討論
7.模組之整合:實驗與評估
7.1 英文翻系統的架構
7.2 實驗與評估
7.3 討論
8.文句對例
8.1 緒論
8.2 對列的標準
8.3 對列的演算法
8.4 對列之評估標準
8.5 對列結果的評估
8.6 討論
9.論域結構與主題辦識
9.1 緒論
9.2 如何規範論域
9.3 論域主題之辦識
9.4 論域結構之分割
9.5 討論與摘要
10.研究成果與未來研究方向
10.1 假設與本質上的特性
10.2 研究成果
10.3 未來研究方向之建議
參考文獻
英文版論文
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top