跳到主要內容

臺灣博碩士論文加值系統

(18.97.14.81) 您好!臺灣時間:2024/12/02 23:01
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:連又箴
研究生(外文):You-Jhen Lian
論文名稱:台語讀音的求法及標註平臺
論文名稱(外文):Taiwanese Reading of Mandarin Words and Its Labeling Platform
指導教授:余明興余明興引用關係
口試委員:古鴻炎江永進
口試日期:2011-07-25
學位類別:碩士
校院名稱:國立中興大學
系所名稱:資訊科學與工程學系所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2011
畢業學年度:99
語文別:中文
論文頁數:34
中文關鍵詞:台語讀音標註平臺
外文關鍵詞:Taiwanese readinglabeling platform
相關次數:
  • 被引用被引用:2
  • 點閱點閱:272
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
本論文將討論如何求取國語詞的台語讀音,我們使用的是照字翻譯,會利用到字的資訊和詞的資訊。詞比起字有更明顯的語意訊息,對我們的方法有很大的幫助。
我們將提供一個網頁界面,把現存的十三萬國語詞典,利用人工標註上台語讀音。在標註的過程中,我們也會給予數個候選的台語讀音,使用者只需要在其中選擇一個正確的答案,搭配系統的發音功能,即便使用者不了解拼音的方法,也可以來進行台語標註的動作。


In this thesis, we will discuss how to find Taiwanese reading of Mandarin Words. The way we use is literal translation. In our method, we use character information and word information. Words have more definite semantic information. It is helpful in improving precision.
We provide a web interface to label Taiwanese reading by the user. Our system would give some possible answers. The users just need to choose the proper one through the help of sound-play function. It''s easy to operate even if the user doesn’t understand Taiwanese phonetic alphabet.


目錄

誌謝......................i
摘要.....................ii
Abstract................iii
目錄.....................iv
表目錄..................vii
圖目錄...................ix
第一章 緒論...............1
1.1研究背景...............1
1.2 研究方向..............2
1.2.1 台語音的求法........2
1.2.2 標註平臺............3
1.3論文架構...............4
第二章 台語讀音的求法.....5
2.1 台語相關特性和規則....5
2.2 照字翻譯..............6
2.3 以詞找詞..............8
第三章 實驗與討論........10
3.1 語料介紹.............10
3.1.1 國台對照詞典.......10
3.1.2 十三萬國語詞典.....12
3.2 實驗相關.............12
3.2.1 統計表.............14
3.3 實驗結果.............17
3.4 實驗討論.............20
第四章 標註平臺..........21
4.1 系統功能與操作.......22
4.2 系統相關.............25
4.2.1 資料準備...........25
4.2.2 候選台語讀音.......26
4.3人工標記後的統計結果..27
第五章 結論..............30
參考文獻.................31
附錄一...................33

表目錄

表3.1 國台對照詞典的統計資料............11
表3.2 訓練語料和測試語料的統計..........13
表3.3 修正過後訓練語料和測試語料的統計..14
表3.4 統計表一..........................14
表3.5 統計表二..........................15
表3.6 統計表三..........................15
表3.7 簡化詞性和精簡詞性的對照表........16
表3.8 實驗一的結果......................17
表3.9 實驗二的結果......................18
表3.10 實驗三的結果.....................18
表3.11 實驗四的結果.....................19
表3.12 實驗五的結果.....................19
表3.13 實驗六的結果.....................20
表4.1 十三萬詞中需標記的統計資料........25
表4.2 統計表............................26
表4.3 一字詞的資料表....................27
表4.4 選項統計表........................28

圖目錄

圖2.1 台語變調規則.........6
圖3.1 國台對照詞典........11
圖3.2 十三萬國語詞典......12
圖4.1 台語讀音標註界面....22
圖4.2 標記的正確率........29



[1] 李尚德,2007,” 台語辭典建構與台語變調探討” ,國立中興大學資
訊科學與工程學系碩士論文。
[2] 林金玉,2008,”中文轉台語文轉音系統中一詞多音之預測”,國立
中興大學資訊科學與工程學系碩士論文。
[3] 林義証、余明興、林金玉、廖盈智,2008,”利用組合式策略來解決
台語文轉音系統中一詞多音問題”。
[4] 林義証、余明興、張唐瑜、潘能煌,2006,“以大量詞彙作為合成單
元的中文文轉音系統”,2006 年台灣網際網路研討會(TANET2006)
論文集。
[5] 黃宣範,1995,“語言、社會與族群意識”,文鶴出版公司。
[6] 許書豪,2010,”台語連音變調問題研究” ,國立中興大學資訊科學
與工程學系碩士論文。
[7] 楊允言,2009,” 台語文處理技術:以變調及詞性標記為例” ,國
立台灣大學資訊工程研究所博士論文。
[8] 廖振淵,2010,”利用粗糙集理論解決中文轉台語文轉音系統中一詞
多音問題” ,國立中興大學資訊科學與工程學系碩士論文。
[9] 潘能煌、余明興、蔡宗謀,2008,"中文文句轉台語語音系統",中華
民國資訊學會通訊,第11卷,第4期,pp.27-38。
[10] 中文詞庫八萬目詞
http://www.aclclp.org.tw/use_ced_c.php
[11] 中研究詞類標記列表
http://ckipsvr.iis.sinica.edu.tw/


QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top