跳到主要內容

臺灣博碩士論文加值系統

(98.84.25.165) 您好!臺灣時間:2024/11/10 01:11
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:王佐
研究生(外文):Tso Wang
論文名稱:架構於GPRS上的分散式國語語音辨識系統之傳送機與接收機設計
論文名稱(外文):Transceiver Design for A Distributed Mandarin Speech Recognition System over GPRS
指導教授:李琳山李琳山引用關係李宇旼李宇旼引用關係
指導教授(外文):Lin-shan LeeYumin Lee
學位類別:碩士
校院名稱:國立臺灣大學
系所名稱:電信工程學研究所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2003
畢業學年度:91
語文別:中文
論文頁數:153
中文關鍵詞:無線環境下分散式語音辨識大字彙連續國語語音辨識分割式向量量化無線通訊區塊碼行動通訊系統無線多媒體通訊分散
外文關鍵詞:Distributed Speech Recognition(DSR) under The Wireless EnvironmentLarge Vocabulary Continuous Mandarin Speech RecognitionSplit Vector Quantization (SVQ)Wireless CommunicationsBlock codeGPRSWireless Multimedia CommunicationsInterleaving
相關次數:
  • 被引用被引用:1
  • 點閱點閱:155
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
隨著行動通訊日益普及,新興的熱門研究領域:分散式語音辨識愈顯得其重要性,也就是在手機端執行語音特徵參數抽取及壓縮,而把其她的語音辨識功能都放在無線網路另一端的伺服器去執行。於是整個無線網路成為語音系統的一部份。而其中的時間延遲 (time delay) 及傳輸錯誤 (transmission error) 等都成了必須解決的問題。本篇論文的主題,著重在如何將上述的主從架構 (client — server architecture) 分散式語音辨識服務與現今的 GPRS (General Radio Packet Service) 行動通訊系統的連結層作緊密的結合。為了克服 GPRS 實體層與連結層的缺陷,本篇論文提出了外部傳送機與接收機的架構與演算法,來達成兩項目的:一、滿足分散式語音辨識服務的即時需求;二、將系統整體的傳輸通道還原成交叉橫越機率 (cross over probability) 低於 10-3 的二元對稱性通道 (binary symmetric channel. BSC),來維持遠端語音辨識器的效能。
本論文主要分為三大部分:第一部份是系統採用的聲學模型。我們會建立大字彙連續國語音節辨識的基礎聲學模型,並測試基礎實驗的語音辨識率。我們會重新探討特徵參數之向量量化的研究議題。不匹配 (mismatched) 的基礎聲學模型與量化失真的匹配 (matched) 聲學模型,對語音辨識器效能的影響,也會在本章用數學理論來說明。本部分的末了,我們會以系統設計者的角度,討論將主從架構分散式語音辨識與 GPRS 結合時,所要考量的設計要素。
第二部份是第一階段的外部傳送機與接收機的設計與效能分析。外部傳送機採用同步緩衝器存取 (synchronous buffer access) 的數位電路架構,並配合外部分散器 (outer interleaver),與瑞德 — 所羅門區塊編碼的訊源保護,來提供主從架構分散式語音辨識服務的即時需求。外部傳送機與接收機的封包:電波連結封框 (radio link frame) 的格式設計,也會在本章陳述。外部分散器的規格與瑞德 — 所羅門區塊碼的錯誤更正能力 (error correction capability) 的決定,是基於電波連接封框的標頭 (header) 沒有解碼錯誤 (decoding error) 或失敗 (failure) 的情形發生下,用理論推導出來的結果。電腦模擬的結果驗證了本階段外部傳送機與接收機的設計,的確優於基礎系統(沒有外部分散器與瑞德 — 所羅門區塊編碼的訊源保護)的系統效能。
第三部份為第二階段的外部傳送機與接收機的設計與效能分析。第一階段的外部傳送機與接收機的設計,只考慮到電波連接封框的標頭沒有解碼錯誤或失敗的情形發生。然而,實際的通道品質,會使得電波連接封框的標頭的解碼過程發生錯誤或失敗。為了克服封框標頭的解碼失敗,而造成的空的碼符號傳播 (null code symbol propagation),本章會重新推導瑞德 — 所羅門區塊碼的錯誤更正能力與外部分散器的分散深度之決定過程。我們也會重新檢視封框標頭的欄位設計,並使用更高保護能力的 BCH 區塊碼作為封框標頭的錯誤保護,以避免封框標頭的解碼錯誤或失敗的情形發生。電腦模擬的結果,會證實第二階段的外部傳送機與接收機的設計,不但解決了封框標頭的解碼失敗的問題,也比第一階段的外部傳送機與接收機的設計有更好的系統效能。
綜觀本篇論文,它結合了語音辨識 (speech recognition)、無線通訊 (wireless communications) 與錯誤更正碼 (error control coding) 等三大領域的背景知識。外部傳送機與接收機的架構與演算法設計,不但顧慮到如何達成主從架構分散式語音辨識服務的需求,也考量到硬體實作上的困難度與複雜度。因此,本篇論文提出的外部傳送機與接收機設計,可以直接與現行的手機結合,或安裝在汽車裡面,讓用戶端只需透過語音,就可以享受隨時隨地使用語音系統包括上網漫遊的樂趣。

第一章 緒論 4
1.1 背景 4
1.2 動機 6
1.3 本論文的主要貢獻 7
1.4 章節概要 8
第二章 行動電波傳遞 10
2.1 電磁波傳播的物理特性 10
2.1.1 直射路徑與反射路徑 10
2.1.2 杜卜勒效應 (Doppler Effect) 12
2.2 大幅度衰減:電波連結路徑損失和陰影遮蔽 14
2.3 小幅度衰減:多重路經衰減 17
2.3.1 瑞雷衰減通道 (Rayliegh Fading Channel) 17
2.3.2 古典杜卜勒延展頻譜和自相關函數 20
2.4 延遲展開 (DELAY SPREAD) 24
2.5 GPRS 實體層簡介 28
2.6 GPRS 實體層模擬器 31
2.6.1 實體層基頻傳送機的架構與演算法 33
2.6.2 離散等價的寬頻頻率選擇衰減通道 35
2.6.3 實體層基頻接收機的架構與演算法 39
2.6.4 GPRS 實體層的電腦模擬結果 39
第三章 基礎系統 44
3.1 大字彙連續國語語音的基礎聲學模型 44
3.1.1 訓練與測試語料 44
3.1.2 語音特徵參數的抽取 46
3.1.3 連續國語音節辨識的聲學模型 48
3.1.4 基礎聲學模型的效能測試 52
3.2 量化失真的匹配聲學模型與不匹配之基礎聲學模型的效能 53
3.2.1 語音特徵參數之向量量化 53
3.2.2 量化失真對語音辨識效能的影響 57
3.2.3 估測理論與量化失真的匹配聲學模型效能 59
3.2.4 不匹配的基礎聲學模型的效能分析 64
3.3 基於 GPRS 之系統設計要素 76
3.4 本章結論 80
第四章 外部傳送機與接收機之設計 (一) 81
4.1 外部傳送機與接收機簡介 81
4.2 外部傳送機 83
4.2.1 外部傳送機的架構與流程 83
4.2.2 外部分散器(一):瑞德 — 所羅門區塊碼的錯誤更正能力的決定 85
4.2.3 外部分散器(一):分散深度的決定 92
4.3 電波連結封框 98
4.4 外部接收機 (一) 的架構與接收流程 103
4.5 電腦模擬結果與效能分析 107
4.6 本章結論 121
第五章 外部傳送機與接收機設計(二) 122
5.1 外部分散器 (二) 122
5.1.1 電波連結封框的標頭設計之改進 122
5.1.2 瑞德 — 所羅門區塊碼的錯誤更正能力與分散深度的重新決定 125
5.1.3 電腦模擬結果與效能分析 133
5.2 本章結論 145
第六章 結論與未來展望 147
6.1 結論 147
6.2 未來展望 148
附錄一 150

. B. Davis & P. Mermelstein, “Comparison of Parametric Representations for Monosyllabic Word Recognition in Continuously Spoken Sentences”, IEEE Trans. Acoustics Speech and Signal Processing, ASSP — 28 (4) : p.p. 357 — 366, August, 1980
2. ETSI ES 201 108 v1.1.1 (2000 — 02), “Speech Processing, Transmission, and Quality aspects (STQ); Distributed speech recognition; Front — end feature extraction algorithms; Compression algorithms”
3. ETSI ES 202 050 v1.1.1(2002 - 07) “Speech Processing, Transmission, and Quality aspects (STQ); Distributed speech recognition; Front — end feature extraction algorithms; Compression algorithms
4. http://htk.eng.cam.ac.uk
5. S. Young, D. Kershaw, J. Odell, D. Ollason, V, Valtchev, & P. Woodland, “The HTK Book (for HTK Version 3.0)”, © COPYRIGHT 1995- 1999 Microsoft Corporation
6. S. Haykin, “Communication Systems”, 3rd edition, 1994, John Wiley & Sons, Inc.
7. S. Haykin, “Communication Systems”, 4th edition, 2000, John Wiley & Sons, Inc.
8. .J. G. Proakis, “Digital Communications”, 3rd edition, 1995, McGraw-Hill, Inc.
9. E. A. Lee & D.G. Messerschmitt, “Digital Communications” 2nd edition, 1994, Kluwer Academic Publishers.
10. G. L. Stuber, “Principles of Mobile Communication”, 1996, Kluwer Academic Publishers
11. S. Ghahramani, “Fundamentals of Probability”, 1996, Prentice Hall, Inc.
12. [Jakes,94] W.C. Jakes, “Microwave Mobile Communications”, IEEE Press, New York,1974
13. [Steele,92] R. Stelle & L. Hanzo, “Mobile Radio Communications”, John Wiley, 1998
14. V. Weerackody, W. Reichi, and A. Potamianos, ”An Error-Protected Speech Recognition System for Wireless Communications¨, IEEE Trans. On Wireless Communications,Vol.. 1 No.2, April, 2002
15. A. Potamianos and V. Weerackody, ”Soft-Feature Decoding for Speech Recognition over Wireless Channels¨, presented in ICASP, Salt Lake City, UT, May, 2001
16. 陳志豪,”GPRS 實體層模擬及其接收機設計”,國立台灣大學電信工程學研究所碩士論文,2001 年 6 月
17. 吳承晃,”無線環境下分散式中文語音辨識之初步研究”,國立台灣大學電信工程學研究所碩士論文,2002 年 6 月
18. 梁伯宇,”國語連續語音辨識之聲學模型研究”,國立台灣大學電機工程學研究所碩士論文,1998 年 6 月
19. P. G. Sherwood & K. Zeger, “Error Protection for Progressive Image Transmission Over Memoryless and Fading Channels”, IEEE Trans. on Communications, Vol. 45, No. 12, December. 1998
20. S. Reed & X. Chen, “Error Control Coding for Data Networks”, Kluwer Academic Publishers, 1999
21. S. R. Saunders, “Antennas and Propagation for Wireless Communication Systems”, John Wiley & Sons, 1999
22. L.C. Ramac & K. Varshney, “A Wavelet Domain Diversity Method for Transmission of Images over Wireless Channels”, IEEE Journal on Selected Areas in Communications, Vol.18, No.6, June, 2000
23. S. Haykin, “Adaptive Filter Theory”, Appendix D — Estimation Theory, 4th edition, Prentice Hall
24. L. Hanzo, P. J. Cherriman, J. Streit, “Wireless Video Communications — Second to Third Generation System and Beyond”, IEEE Press, 2000
25. EN 300 421 v1.1.2(1997-08), “Digital Video Broadcasting(DVB); Framing structure, channel coding and modulation for 11/12 GHz satellite services”
26. J. Lai & N. B. Mandayam, “Performance of Reed-Solomon Codes for Hybrid-ARQ over Rayleigh Fading Channels Under Imperfect Interleaving”, IEEE Trans. On Communications, Vol. 48, No.10, October, 2000
27. S. Young, “A Review of Large-vocabulary Continuous—speech Recognition”, IEEE Signal Processing Magazine, p.p. 45 — 57, September, 1996
28. M. J. F. Gales, “Model Based Techniques for Noise Robust Speech Recognition”, dissertation submitted to the University of Cambridge for the degree of Doctor of Philosophy, September, 1995
29. R. E. Blahut, "Theory and Practice of Error Control Codes", Addison Wesley, 1983
30. GSM 05.05 v7.1.0 Release 1998
31. 3GPP TS 05.05 v7.9.0 (2002-08), “3rd Generation Partnership Project; Technical Specification Group GSM/EDGE Radio Access Network; Radio transmission and reception (Release 1998)”
32. P. Dent, G. E. Bottomley & T. Groft, “Jakes Fading Model Revisited”, Electronics Letters, 24th June, 1993, Vol. 29, No.13 p.p.1162 — 1163
33. P. P. Vaidyanathan, “Multirate Systems and Filter Banks”, Prentice Hall, 1993
34. A.V. Oppenheim, R. W. Schafer, & J. R. Buck, “Discrete Time Signal Processing”, 2nd edition, Prentice Hall, 1999
35. H. Meyr, M. Moeneclaey, & S. A. Fechtel, “Digital Communication Receivers — Synchronization, Channel Estimation and Signal Processing”, Wiley Series in Telecommunications and Signal Processing, 1997
36. L. Rabiner, B. H. Juang, “Fundamentals of Speech Recognition”, Prentice Hall 1993
37. C. Becchetti, L. P. Ricotti, “Speech Recognition — Theory and C++ Implementation”, John Wiley and Sons, 1999
38. A. Bernand, & A. Alwan, “Low-Bitrate Distributed Speech Recognition for Packet-Based and Wireless Communication”, IEEE Trans. On Speech and Audio Processing, Vol. 10, No. 8, p.p. 570 —579, November, 2002
39. L. S. Lee & Y. Lee, “Voice Access of Global Information for Broad-Band Wireless: Technologies of Today and Challenges of Tomorrow”, Proceedings of The IEEE, Vol. 89, No.1, p.p. 41 — 57, January 2001
40. S. B. Wicker, “Reed-Solomon Error Control Coding for Rayleigh Fading Channels with Feedback”, IEEE Trans. On Vehicular Technology, Vol. 41, No. 2, May 1992
41. C. E. Shannon, “A Mathematical Theory of Communication“, Bell Syst. Tech. Journal, Vol. 27, p.p. 379 — 423 and p.p. 623 — 656, 1948
42. S. B. Lippman & J. Lajoie, “C++ Primer”, 3rd edition, Addison Wesley, 1998

QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
1. 呂芳上,〈娜拉出走以後──五四到北伐青年婦女的活動〉,《近代中國》,92,1992年。
2. 李鎨澂,〈一代漢學家與中國法巨擘:約翰.艾斯卡拉(Jean Escarra,1885──1955)〉,《法制史研究》創刊號,2000年。
3. 李復甸,〈傳統家制與現代立法〉,《華岡法粹》18,1987年。
4. 林崗,〈宗法新解〉,《九州學刊》4:2,1991年。
5. 林端,〈「國家制定法」與「民間習慣」──台灣「祭祀公業」的歷史社會分析(Ⅰ)(Ⅱ)〉,《法制史研究》創刊號、2,2000年、2001年。
6. 林咏榮,〈我國固有倫理與現行法制〉,《法學叢刊》32:2,1987年。
7. 許家馨,〈評王伯琦先生著《近代法律思潮與中國固有文化》〉,《法制史研究》創刊號,2000年。
8. 梁治平,〈傳統及其變遷:多元景觀下的法律與秩序〉,《二十一世紀》47,1998年。
9. 陳民,〈中國親子關係的傳統思想〉,《法律評論》29:2,1963年。
10. 陳添輝,〈以繼受外國法律做為開發中國家現代化之工具〉,《東海大學法學研究》5,1989年。
11. 黃純怡,〈宋代戶絕之家的立嗣──以判例為主的探討〉,《興大人文學報》32,2002年。
12. 潘維和,〈民事法律關係之法制史的研究〉,《法學叢刊》80,1975年。
13. 鍾年,〈宗法、保甲、鄉約──兩宋時期的鄉村社會控制〉,《歷史月刊》103,1996年。
14. 白瑞生(2000)‧兒童癌症存活者的生活議題‧護理雜誌,47(4),17-21。
15. 江春菊、王毓萱(2000)‧經腦室--腰椎灌注藥物(ACNU)技術之臨床運用‧護理雜誌,47(4),5-10。