(34.204.201.220) 您好!臺灣時間:2021/04/20 12:52
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:陳志佳
研究生(外文):Zhi-Jia Chen
論文名稱:非對稱雙處理器架構實現嵌入式語者辨識系統
論文名稱(外文):Development of AMP - based Embedded Speaker Recognition System
指導教授:蔡孟伸蔡孟伸引用關係
指導教授(外文):Men-Shen Tsai
口試委員:黃世杰鄭有進
口試日期:2007-07-12
學位類別:碩士
校院名稱:國立臺北科技大學
系所名稱:自動化科技研究所
學門:工程學門
學類:機械工程學類
論文種類:學術論文
論文出版年:2007
畢業學年度:95
語文別:中文
論文頁數:77
中文關鍵詞:語者辨識軟硬體共設計嵌入式系統
外文關鍵詞:Speaker RecognitionHardware Software Co-DesignEmbedded System
相關次數:
  • 被引用被引用:0
  • 點閱點閱:67
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
本論文主要依據非對稱多處理器設計概念實現需要複雜訊號處理與決策流程的語者辨識系統。並提出針對語者辨識問題改良的類神經演算法,使用競爭式學習法,並在類神經的訓練過程中的後期,強調了小範圍內的總體特徵。訓練後的模型可成為小範圍內的群體聚集中心,目的是為了使競爭式學習法的類神經網路可以和使用統計模型計算參數通過機率,且又保持類神經網路擁有很高分類正確率的優點。系統實現部分包括:可程式系統晶片設計(SOPC)、平行計算機架構(Parallel Computer Architecture)、系統軟硬體共同設計(Hardware Software Co-design)、作業系統的驅動方法與資源管理機制等,系統中包含ARM處理器與可被FPGA合成的NIOS II處理器,借助兩顆處理器不同的優勢互補,達成系統效能的提升。
依實驗結果針對語者辨識問題改良的類神經演算法,可承襲了向量量化低運算量的優點,更提高了訓練模型的辨別率,特別適合應用於運算處理能力與記憶體資源有限的嵌入式系統中。在經過雙處理器系統最佳化的系統分割後,系統可達成即時訊號處理的效能表現,並以語音辨識協同語者辨識達成雙重身份驗證機制,且有能力負擔複雜圖形使用者圖形介面。
The main contribution of this thesis is to develop an embedded speaker recognition system with Asymmetric Multiprocessing architecture, and propose an improved ANN algorithm for speaker identification applications. Artificial Neural Network process emphasizes overall features with small area vocal signal characteristics. Improved ANN model can be used for estimated probabilities and provide a high speaker identification rate based on Learning Vector Quantization (LVQ) trained codebooks. System implementation tasks can be divided into to System on Programmable Chip design (SOPC), Parallel Computer Architecture and Hardware Software Co-design. The proposed system is implemented on ARM-based and NIOS II-based embedded platforms to perform the speaker recognition function. The strengths of different processors are implemented in order to improve the overall system performance.
The experimental results show that the proposed improved ANN model gives a higher speaker identification and verification rate than the LVQ and GMM trained codebooks. The improved ANN model utilizes the low computational complexity of LVQ. This is important when the speaker identification is implemented on a computation limited embedded system. The system can reach the real time signal processing capability, while provide the capabilities of complicated GUI.
中文摘要 i
英文摘要 ii
目錄 ii
表目錄 iv
圖目錄 v
第一章 緒論 1
1.1 研究動機 1
1.2 文獻回顧 2
1.3 論文架構 5
第二章 相關知識 6
2.1 語音辨識概論 6
2.1.1 語音訊號前處理 6
2.1.2 擷取特徵參數 8
2.1.3 語者辨識方法 10
2.1.4 語音辨識方法 12
2.2 嵌入式系統實現方法 16
2.2.1 系統晶片設計 17
2.2.2 作業系統 19
2.2.3 軟硬體共同設計 20
第 三 章 改進語音辨識核心 23
3.1 學習向量量化 23
3.2 徑向基底函數類神經網路 27
3.3 神經網路結合統計與量化模型 28
第 四 章 系統架構 34
4.1 系統模型 34
4.2 軟硬體分割與系統最佳化 36
4.2.1 硬體設計 37
4.2.2 軟體設計 39
4.3 系統實現 41
4.3.1 主系統 41
4.3.2 協同處理系統 46
4.4 系統整合 52
4.4.1 介面硬體架構 53
4.4.2 介面軟體架構 57
第五章 實驗結果 62
5.1 實驗環境設定 62
5.2 語者分類引擎評估 63
5.2.1 辨識效果 64
5.2.2 執行效率 66
5.3 系統效能 68
5.3.1 主系統效能 68
5.3.2 協處理系統效能 69
5.4 系統測試 70
第六章 結論與未來展望 72
6.1 結論 72
6.2 未來展望 72
參考文獻 74
[1]Pravinkumar Premakanthan and Wasfy. B. Mikhael, “Speaker verification recognition and the importance of selective feature extraction: review,” Circuits and Systems, Dayton, OH, 14-17 Aug. 2001, pp.57-61
[2]J. Deller, J. Proakis and J. H. Hansen, Discrete-Time Processing of Speech Signal, Macmillan ,2000
[3]T. Kohonen, "The self-organizing map," Proceedings of the IEEE, Sep. 1990, Vol.78, no.9, pp.1464-1480.
[4]Jialong He, Li Liu, and G. Palm, "A discriminative training algorithm for VQ-based speaker identification," IEEE Transaction on Speech and Audio Processing, May. 1999, Vol. 7, no. 3 pp.353 – 356
[5]S. Phadke, R. Limaye, S. Verma, K. Subramanian, "On design and implementation of an embedded automatic speech recognition system," VLSI Design, 2004. Proceedings. 17th International Conference on , 2004, Indian Institute of Technology, Mumbai India , pp.127-132
[6]黃禎智,基於語者模型梅爾倒頻譜係數與類神經網路之主從式即時語者辨識系統,碩士論文,國立台北科技大學,自動化科技研究所,2005。
[7]F. Vargas, R.D. Fagundes, Barros, D., Jr, "A new approach to design reliable real-time speech recognition systems," On-Line Testing Workshop, 2001. Proceedings. Seventh International, July 2001, pp.187-191
[8]王小川,語音訊號處理,台北:全華科技圖書有限公司,2004。
[9]Jyh-Shing Roger Jang, 線上教材:音訊處理與辨識Home page:http://neural.cs.nthu.edu.tw/jang/books/audioSignalProcessing
[10]Sanjit K. Mitra, Digital Signal Processing – A Computer-Based Approach, 2nd Ed, McGraw-Hill, 2002.
[11]R. Gray, “Vector quantization,” IEEE Transactions on Acoustics,Speech and Signal Processing, Jan. 1984, pp. 4-29.
[12]D. A. Reynolds, "A Gaussian Mixture Modeling Approach to Text-Independent Speaker Identification," Ph.D. Thesis, Georgia Institute of Technology, 1992
[13]L.E. Baun, T. Petrie, “Statistical Inference for Probabilistic Functions of Finite State Markov Chains,” Annual of Mathematical Statistics, 1966, 37:1554-1563
[14]李維仁、柯力群、胡繼陽、張志龍,嵌入式系統導論,台北:學貫行銷股份有限公司,2004。
[15]林名波,微算機原理與應用-80X86/Pentium系列軟體、硬體、介面、系統,台北:全華科技圖書有限公司,1998。
[16]T.E.F. Filho, R.O. Messina and E.F. Jr. Cabral, "Learning Vector Quantization in Text-Independent Automatic Speaker Recognition," Proceedings 5th Brazilian Symposium on Neural Networks, 1998, Dec. 1998, pp.135-139, 9-11
[17]Y. Linde, A. Buzo and R. Gray, "An algorithm for vector quantizer design", IEEE Transactions on Communications, [legacy, pre - 1988] , Jan. 1980, vol.28, no.1, pp. 84- 95
[18]Simon Haykin, Neural Networks: A Comprehensive Foundation, Prentice Hall , 1998.
[19]R.C. Freeman, D.M. Skapura, Neural networks-Algorithm, Applications, and Programming Techniques, Addison-Wesley, 1991.
[20]德州儀器公司,國科會「自由軟體嵌入式系統計畫」嵌入式TI DaVinci 平台訓練課程Training Manual,新竹:財團法人國家實驗研究院國家晶片系統設計中心,2006。
[21]邱成中,系統晶片平台之驅動程式設計與自動化合成研究,碩士論文,雲林科技大學,電子工程研究所,2004。
[22]David A Rusling, The Linux Kernel Version 0.8-3, LDP Document, 1999.
[23]Jean J. Labrosse, MicroC/OS II The Real Time Kernel, CMP Media Inc., 1999.
[24]劉崢嶸、張智超、許振山、郝文化,Linux嵌入式系統開發,台北:文魁資訊股份有限公司,2005。
[25]Matthias Kalle Dalheimer, Programming with Qt, O’Reilly, 2000.
[26]T. Iwai, “Sound systems on linux: From the past to the future,” Linux 2003 Conference, Edinburgh, Scotland, 2002 May 16.
[27]S. Young., The HTK Book (for HTK Version 3.4), Cambridge University Engineering Department , 2002
[28]Zhao Ming , CFFT A new radix 4 complex fft processor, OPENCORES.ORG, 2003.
[29]Volder, Jack E., "The CORDIC Trigonometric Computing Technique," IRE Transactions on Electronic Computers, Sep. 1959. pp. 330-334.
[30]J. Corbet, A. Rubini, and G. Kroah-Hartman, Linux Device Drivers, 3rd ed, O’Reilly, 2005.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
系統版面圖檔 系統版面圖檔