跳到主要內容

臺灣博碩士論文加值系統

(3.235.185.78) 您好!臺灣時間:2021/07/27 16:38
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:陳增安
研究生(外文):Zhen-An Chen
論文名稱:語音辨識與對話策略
論文名稱(外文):A Study on Speech Recognition and Dialogue Policies
指導教授:黃永廣黃永廣引用關係
指導教授(外文):Wing-Kwong Wong
學位類別:碩士
校院名稱:國立雲林科技大學
系所名稱:電子與資訊工程研究所碩士班
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2004
畢業學年度:92
語文別:中文
論文頁數:60
中文關鍵詞:對話策略語音辨識強化學習梅爾特徵參數隱藏式馬克夫模型
外文關鍵詞:SpeechlearningReinforcementDialogue PoliciesRecognition
相關次數:
  • 被引用被引用:1
  • 點閱點閱:184
  • 評分評分:
  • 下載下載:35
  • 收藏至我的研究室書目清單書目收藏:0
在本論文中,我們將語音辨識與對話策略結合在一起。在辨識系統中,我們利用梅爾頻譜分析(MFCC)取得特徵值,然後再使用向量量化(VQ)方式取得碼書,再用隱藏式馬可夫模型(HMM)訓練出每個聲音的模型;辨識方面是利用維特比(Viterbi)找出最接近的樣本聲音。我們利用語音辨識器來辨識關鍵字後,當作對話系統的輸入。在對話系統的對話策略方面,我們運用強化學習(RL theory)並以在咖啡店裡點咖啡為對話範例,讓代理人扮演店員的角色來訓練其對話策略,使得店員知道何時問什麼問題較為合理。
This thesis studies two aspects of a dialog agent that communicates with human users in natural language. The first aspect is speech recognition, which recognizes voice signals as textual sentences. The second is dialogue policy, which determines how the agent responds to a user in various conditions. The agent can improve its dialogue policy with a reinforcement learning algorithm.
目 錄

中文摘要……………………………………………………………………………….i
英文摘要……………………………………………………………………………....ii
誌謝…………………………………………………………………………………...iii
目錄…………………………………………………………………………………...iv
表目錄…………………………………………………………………………….….vii
圖目錄……………………………………………………………………………….viii
第一章 緒論
1.1 研究動機 ……………………………………………………………………1
1.2 研究方法 ……………………………………………………………………2
1.3論文架構 ……………………………………………………………………2
第二章 文獻探討
2.1語音辨識的技術….…………………………………………………………4
2.2對話策略探討……………………………………………………………….6
第三章 語音辨識
3.1研究方法……………………………………………………………….…..11
3.2聲音特徵值之計算………………………………………………………...14
3.2.1高頻訊號之補強…………………………………………………….14
3.2.2漢明視窗…………………………………………………………….14
3.2.3離散傅立葉轉換……………………………………………………..15
3.2.4濾波器處理…………………………………………………………..16
3.2.5對數能量運算及梅爾倒頻譜計算…………………………………..17
3.3訓練語音模型………………………………………………………………17
3.3.1 HMM設計之理論基礎……………………………………………..20
3.3.2 HMM機率計算……………………………………………………..22
3.3.2.1正算程式 (Forward procedure)…………………………….22
3.3.2.2逆算程式 (Backward Procedure)…………………………..23
3.3.2.3 Forward-Backward Recursion……………………………..24
3.3.3訓練HMM 模型 …………………………………………………..24
3.4辨識方式…………………………………………………………………..26
3.4.1維特比演算法………………………………………………………26
3.4.2測試辨識器…………………………………………………………28
3.4.2.1實驗內容設定………………………………………………28
3.4.2.2實驗結果……………………………………………………29
3.3.2.3討論………………………………………………………31
3.5本對話策略的對話內容詞彙辨識………………………………………..31
第四章 強化學習運用於對話策略理論基礎
4.1強化學習理論介紹………………………………………………………33
4.2對話策略訓練……………………………………………………………33
4.3實驗和討論………………………………………………………………35
4.3.1最短路徑學習………………………………………………………35
4.3.1.1店員模型…………………………………………………35
4.3.1.2決定動作方法……………………………………………36
4.3.1.3即時回饋的給定…………………………………………36
4.3.1.4顧客(環境模型)………………………………………….37
4.3.1.5實驗過程…………………………………………………38
4.3.1.6實驗結論…………………………………………………48
4.3.2學習確認……………………………………………………………49
4.3.2.1決定動作方法………………………………………………50
4.3.2.2回饋的給定…………………………………………………50
4.3.2.3實驗過程……………………………………………………51
4.3.2.4實驗結論……………………………………………………52
第五章 總結
5.1組合語音辨識和對話策略………………………………………………55
5.2討論………………………………………………………………………56
5.2.1語音的問題………………………………………………………56
5.2.2對話策略…………………………………………………………57
5.3未來和展望………………………………………………………………58
參考文獻……………………………………………………………………………..59
參考文獻
[1] Sutton, R. S. and Barot, A. G. (1998). Reinforcement Learning: An Introduction. MIT Press.
[2]Singh, S., Litman, D., Kearns, M., Walker, M. (2002). Optimizing dialogue management with reinforcement learning: Experiments with NJFun system. Journal of Artificial Intelligence Research, 16, 105-133.
[3]Claudio Becchetti and LucioPrina Ricotti (1999). Speech Recognition Theory and C++ Implementation. JOHN WILEY & SONS, LTD Inc. New York USA.
[4]陳智聰,民國91年,語音辨識與語言模型,國立雲林科技大學電子與資訊工程研究所碩士論文。
[5] A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition, L. R. Rabiner, Proc. IEEE, Vol. 77, No. 2, pp. 257?286, February 1989
[6] Lai, Jim Z.C. and Lue, C.C., Fast Search Algorithms for VQ Codebook Generation. JVCIR(7), No. 2, PP163-168, 1996.
[7] Qiang Huo and Chorkin Chan, Contextual Vector Quantization for Speech Recognition with Discrete Hidden Markov Model. Speech, Image Processing and Neural Networks, Proceedings of ISSIPNN 1994, Page(s): 698 -701 vol.2.
[8] L. R. Rabiner / R. W. Schafer Digital Processing of Speech Signals Prentice-Hall, Inc., Englewood Cliffs, New Jersey 076322
[9] Stuart Russell and Peter Norvig Artificial Intelligence A Modern Approach (2e), Pearson Education International,2003
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top