跳到主要內容

臺灣博碩士論文加值系統

(44.221.73.157) 您好!臺灣時間:2024/06/17 23:11
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:劉玉情
研究生(外文):Liu, Yu-Ching
論文名稱:文本相關之語者識別及其不佳輸入之濾除機制
論文名稱(外文):Research on Text-dependent Speaker Identification with Screening Mechanism for Impropriate Speech Inputs
指導教授:張智星張智星引用關係
指導教授(外文):Jang, Jyh-Shing Roger
學位類別:碩士
校院名稱:國立清華大學
系所名稱:資訊工程學系
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2009
畢業學年度:97
語文別:中文
論文頁數:46
中文關鍵詞:語者識別文本相關動態時間扭曲
外文關鍵詞:Speaker identificationText-dependentDTW
相關次數:
  • 被引用被引用:2
  • 點閱點閱:205
  • 評分評分:
  • 下載下載:25
  • 收藏至我的研究室書目清單書目收藏:2
本論文主要基於語者識別應用在門禁系統下所作的研究,為了安全上的考量,測試語音和參考語音皆為文本相關(Text Dependent),且以動態時間扭曲(Dynamic Time Warping, DTW)的方法作語者識別。而本論文的目標是希望能夠提升語者識別的初始辨識率,因此提出兩大改善的方法,分別為改善端點偵測錯誤、濾除不佳的測試語音。

首先將測試語音和參考語音擷取出13維的MFCC,利用13維的MFCC作動態時間扭曲比對後,得到初始語者識別的辨識率。根據初始辨識錯誤的音檔作分析,得知端點偵測(Endpoint Detection)錯誤是影響辨識錯誤的主要原因,進而提出改善端點偵測錯誤的方法,使得在特徵擷取前即排除端點標錯的可能。在本論文中,提出改善端點偵測錯誤的方法有兩種,分別為改善端點偵測錯誤接受和改善端點偵測錯誤拒絕。

除此之外,不佳的測試語音也會造成語者識別上的錯誤,因此須在語者識別之前濾除不佳的測試語音,在本論文中,提出兩種濾除不佳測試語音的方法,一種為設定拒絕門檻值,另一種為拒絕不完整的測試語音。其中設定拒絕門檻值的部份,根據特徵擷取出的平均音量、平均音高、平均清晰度和音框數四種特徵參數,分別使用各別特徵參數設定門檻值,以及高斯混合模型設定門檻值。另外,測試語音可能包含錄音內容不完整的情形,若能事先拒絕錄音不完整的測試語音,語者識別的錯誤率就能降低。如此一來,便能在尚未比對參考語音之前,濾除一些可能會造成辨識錯誤的測試語音,使得辨識結果的準確率提升。
第1章 緒論 1
1.1. 研究動機 1
1.2. 語者辨認概述 2
1.3. 資料庫 3
1.4. 研究方向與主要成果 4
1.5. 章節摘要 5
第2章 語者辨認的基本技術 7
2.1. 語者辨認的相關研究 7
2.2. 特徵參數擷取 8
2.2.1. 梅爾倒頻譜參數 8
2.2.2. 平均音量 10
2.2.3. 平均音高 11
2.2.4. 平均清晰度 12
2.2.5. 音框數 13
2.3. 動態時間扭曲 14
第3章 提升語者識別辨識率的方法 16
3.1. 改善端點偵測錯誤 16
3.2. 設定拒絕門檻值 19
3.2.1. 各別特徵參數的拒絕門檻值 20
3.2.2. 高斯混合模型 20
3.3. 拒絕不完整的測試語音 22
第4章 實驗結果與分析 25
4.1. 初始語者識別的實驗結果與分析 25
4.2. 改善端點偵測錯誤的實驗結果 26
4.2.1. 改善端點偵測錯誤接受的實驗結果與分析 26
4.2.2. 改善端點偵測錯誤拒絕的實驗結果與分析 29
4.3. 設定拒絕門檻值的實驗結果 31
4.3.1. 各別特徵參數設定門檻值的實驗結果 31
4.3.2. 高斯混合模型設定門檻值的實驗結果 37
4.4. 拒絕不完整測試語音的實驗結果 40
4.5. 錯誤分析 42
第5章 結論與展望 43
參考文獻 45
【1】 Joseph P. Campbell, Jr., Speaker recognition: A tutorial, Proceedings of the IEEE Volume 85, Issue 9, Sep 1997.
【2】 Wutiwiwatchai, C. Achariyakulporn, V. Tanprasert, C. , Text-dependent speaker identification using LPC and DTW for Thailanguage, TENCON 99. Proceedings of the IEEE Region 10 Conference.
【3】 陳江村, 張智星, 李俊毅, 吳銘鈞, “結合HMM和DTW的兩階段式門禁系統”, Proceedings of the Seventh Conference on Artificial Intelligence and
Applications (第七屆人工智慧與應用研討會), Tai-Chung, Taiwan, Nov 2002.
【4】 吳銘鈞, ”以音節為基礎之語者識別”, 清華大學碩士論文, 民國92年
【5】 林青慧, “強韌式語者辨識系統:從麥克風、市話到手機”, 清華大學碩士論文, 民國93年
【6】 趙怡翔, “鑑別式訓練法於語者驗證之研究”, 交通大學博士論文, 民國98年
【7】 許世俊, “用於高斯混合模型語者辨認之區別式訓練方法”, 清華大學碩士論文, 民國85年
【8】 吳金池, “語者辨識系統之研究”, 中央大學碩士論文, 民國90年
【9】 陳俊傑, “類神經模糊與軟式計算在語者辨識上的應用”, 清華大學碩士論文, 民國86年
【10】Philip McLeod, Geoff Wyvill, A smarter way to find pitch, University of Otago. Department of Computer Science, 2005.
【11】Jyh-Shing Roger Jang, 線上中文教材: 音訊處理與辨識
http://neural.cs.nthu.edu.tw/jang/books/audioSignalProcessing/
【12】 張文杰, 陳鼎允, 陳子和, 曾志仁, 廖元甫, 莊堯棠, “結合韻律與聲學訊息之強健性漢語語者驗證系統”, Chinese computational linguistics (ROCLING), 2006.
【13】 李俊毅, “語音評分”, 清華大學碩士論文, 民國91年
【14】 楊壁如, “語者與歌者識別”, 清華大學碩士論文, 民國89年
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top