跳到主要內容

臺灣博碩士論文加值系統

(18.97.14.82) 您好!臺灣時間:2025/02/15 02:19
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:李運寰
研究生(外文):Yun-Huan Lee
論文名稱:以樹狀資料結構為基礎之語音對話系統
論文名稱(外文):Spoken Dialogue System based on Tree Structure Database
指導教授:李琳山李琳山引用關係
學位類別:碩士
校院名稱:國立臺灣大學
系所名稱:資訊網路與多媒體研究所
學門:電算機學門
學類:軟體發展學類
論文種類:學術論文
論文出版年:2008
畢業學年度:96
語文別:中文
論文頁數:78
中文關鍵詞:語音對話系統樹狀資料結構部分觀測馬可夫決策程序機率式潛藏語意分析模型
外文關鍵詞:dialog systemPLSAPOMDP
相關次數:
  • 被引用被引用:0
  • 點閱點閱:428
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:1
語音對話系統最主要的特色是利用語音當作輸入方式,讓使用者與軟體應用系統作互動。由於使用者語音可以包含豐富的資訊,因此比較起傳統使用鍵盤、滑鼠當作輸入的方法,操作上能夠較不受軟體應用系統限定的步驟所限制,可以用較短的時間獲得軟體中的資訊,或是快速的使用我們需要的功能。
本論文提出的語音對話系統,建立在一套已有的樹狀資料結構檔案上,我們希望利用語音對話系統的特點,快速的操作並擷取所需要的資訊。而我們針對樹狀的資料結構,在系統中的對話模型元件做改進,並使用簡化式的部分觀測馬可夫決策程序來做出系統回應。又由於語音對話系統的使用者,可能以較為口語化的語句來使用系統,因此我們利用網路上所蒐集到的語料,來訓練機率式潛藏語意分析模型,再利用此模型當成我們口述語言理解元件中,求得使用者語句與系統對話狀態相似度的方法。
在實驗的架構上,我們利用模擬的使用者語料,實驗我們改進傳統對話系統部分元件之後的對話系統,系統在整體效能上的提升。實驗結果顯示,經過我們在對話模型和口述語言理解兩大元件作改進後,我們不但能夠更快速的獲得資料庫的資訊,且在對話系統的任務完成成功率上,也有很大的進步。
致謝 iii
摘要 v
目錄 vii
圖目錄 xi
表目錄 xiii
第一章 導論 1
1.1 研究動機 1
1-2 相關研究 2
1-2-1 技術導向 2
1-2-2 目標導向 3
1-2-3 系統改善 3
1-3 研究方向與成果 4
1-4 章節安排 5
第二章 背景知識 7
2-1 整體架構介紹 7
2-2 資料庫 9
2-3對話模型 11
2-3-1 對話狀態 11
2-3-2 對話管理員 12
2-4 口述語言理解 13
2-4-1 語音辨識 14
2-4-2 語言理解 15
2-4-3 語意分類 15
2-5 語句生成及語音合成 16
2-6 本章結論 17
第三章 以樹狀結構資料庫為基礎之對話模型 19
3-1 系統目的及背景資料庫 19
3-2 樹狀結構對話狀態 20
3-3 部分觀測馬可夫決策程序(POMDP) 22
3-4 以部分觀測馬可夫決策程序為決策之對話管理員 24
3-4-1 簡化式部分觀測馬可夫決策程序 24
3-4-2 節點轉移機率的取得方法 25
3-4-3 節點觀測機率的取得方法 27
3-5 本章結論 28
第四章 利用使用者語句求得節點觀測機率 31
4-1 前處理 31
4-1-1 斷詞 31
4-1-2 計算倒文件頻值(IDF) 33
4-2 字串比對法求相似度 34
4-3 機率式潛藏語意分析模型 35
4-3-1 潛藏觀念模型 35
4-3-2 使用最大期望值演算法求取潛藏觀念模型 37
4-4 利用機率式潛藏語意分析模型求相似度 39
4-4-1 模型訓練語料 39
4-4-2 訓練模型語料的前處理 40
4-4-3計算相似度 41
4-5 實驗與評估 42
4-5-1 實驗語料介紹 42
4-5-2 實驗方法與結果: 42
4-5-3 實驗討論 44
4-6 本章結論 45
第五章 系統效能實驗與探討 47
5-1 關鍵詞擷取正確率實驗 47
5-1-1 關鍵詞擷取正確率的衡量辦法 47
5-1-2參數調整 48
5-1-3 實驗結果 50
5-1-4實驗討論 51
5-2 系統整體效能的衡量 51
5-2-1 衡量系統效能的實驗設計 52
5-2-2 系統設計分類 53
5-2-3 模擬使用者語料方法及分類 54
5-2-4 計算使用者與系統對話次數的系統效能實驗 55
5-2-5 計算對話任務完成成功率的系統效能實驗 55
5-2-6 實驗討論 57
5-3 本章結論 57
第六章 結論與展望 59
6.1 結論 59
6-2 展望 60
6-2-1節點轉移機率的設定 60
6-2-2 相似度計算實驗的改進 61
6-2-3 以真實使用者語料衡量系統效能 61
參考資料 63
參考資料
[1]王瑞璋, “改善中文語音對話系統的若干相關技術 (Relevant Technologies For Improved Chinese Spoken Dialogue Systems)” , 博士論文, 國立台灣大學電信工程學研究所,2007
[2]Alexander Gruenstein, Stephanie Seneff, “Context-Sensitive Language Modeling for Large Sets of Proper Nouns in Multimodal Dialogue System” , in SLT 2006.
[3]Antoine Raux, Maxine Eskenazi, “A Multi-Layer Architecture for Semi-Synchronous Event-Driven Dialogue Management”, in ASRU 2007.
[4]Shiu-Wah Chu, Ian O’neill, Philip Hanna, “Using Multiple Strategies to manage Spoken Dialogue”, in InterSpeech 2007.
[5]Geoffrey Zweig, Patrick Nguyen, Y.C.JU, Ye-Yi Wang, Dong Yu, Alex Acero, “The Voice-Rate Dialog System for Consumer Ratings”, in InterSpeech 2007.
[6]Jason D. Williams, “A Method for Evaluating and Comparing User Simulations”, in ASRU 2007.
[7]Sebastian Moller, Klaus-Peter Engelbrecht, Antti Oulasvirta, “Analysis of Communication Dailures for Spoken Dialogue Systems” , in InterSpeech 2007.
[8]Steve Young, “Talking to Machine”, Cambridge University Engineering Department Trumptington Street, Cambridge, England, CB2 1PZ.
[9]JD Williams, P Poupart, SJ Young, “Partially Observable Markov Decision Processes with Continuous Observations for Dialogue Management”, in SIGDIAL 2006.
[10] Yi-cheng Pan and Lin-shan Lee ,“Type-II Dialogue Systems for Information access from Unstructured Knowledge Sources”, in ASRU 2007.
[11] Steve Young, Jost Schatzmann, Karl Weilhammer, Hui Ye, “The Hidden Information State Approach to Dialog Management”, in ICASSP 2007.
[12] 中央研究院中文自動斷詞系統, http://ckipsvr.iis.sinica.edu.tw/
[13] Jade Goldstein, Mark Kantrowitz, Vibhu Mittal and Jaime Carbonell, “Summarizing Text Documents: Sentence Selection and Evaluation Metrics”, Proc. SIGIR, 1999.
[14] Thomas Hofmann, “Probabilistic Latent Semantic Analysis”, Uncertainity in Artificial Intelligence, UAI’99, Stockholm.
[15] A.P.Dempster, N. M. Laird, and D.B. Robin, “Maximum Likelihood from Incomplete Data via the EM Algorithm,” Journal of Royal Statist., 1977.
[16] R.C. Rose, “Word spotting – extracting partial information from continuous utterance”, in the book “Automatic Speech and Speaker Recognition,” edited by C.H. Lee et al.
[17] B. Chen et al., “A*-Admissible Key-Phrase Spotting with Sub-Syllable Level Utterance Verification", ICSLP 1998
[18] Jost Schatzmann and Blaise Thomson and Steve Young, “Error Simulation for Training Statistical Dialogue Systems”, in ASRU 2007.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top