跳到主要內容

臺灣博碩士論文加值系統

(18.204.48.64) 您好!臺灣時間:2021/07/30 09:47
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:黃品甄
研究生(外文):Pin-Jen Huang
論文名稱:護理記錄語料及辭典之建置與應用於語音辨識之可行性評估
論文名稱(外文):The Feasibility Study of Building a Routine Nursing Records Corpus, Lexicon and Its Application in the Speech Recognition
指導教授:張博論張博論引用關係
指導教授(外文):Polun Chang
學位類別:碩士
校院名稱:國立陽明大學
系所名稱:生物醫學資訊研究所
學門:工程學門
學類:生醫工程學類
論文種類:學術論文
論文出版年:2009
畢業學年度:97
語文別:中文
論文頁數:56
中文關鍵詞:護理記錄語料庫護理記錄辭典語言模型語音辨識
外文關鍵詞:nursing record corpusnursing record lexiconlanguage modelspeech recognition
相關次數:
  • 被引用被引用:0
  • 點閱點閱:315
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
在醫療環境高度科技化及電子病歷發展之下,病人資訊的存取經常需要透過電腦,但忙碌的護理人員通常無法固定在電腦前使用鍵盤和滑鼠與電腦溝通,而人類的「語言」是最自然的溝通方式;如果以語音做為護理人員輸入護理記錄的介面,不但感覺親切、自然,更可提昇使用的效率。過去二十年間,電腦軟、硬體的日新月異,促使語音辨識技術快速發展,國外已可將語音辨識技術應用於醫療領域,如放射線報告的語音轉寫、手術中語音輸入記錄等;當相同的語音辨識技術要應用到中文時,面臨到的是本土化護理記錄語料庫及辭典的缺乏;因此本研究之目的在於建置護理記錄語料庫與辭典,並評估語音辨識應用於護理記錄時之可行性。研究進行方式分為三個階段:第一階段為建置護理記錄語料庫,第二階段為建置護理記錄辭典,第三階段分別建立兩組語言模型並計算其混淆度做為第一、二階段之評值;研究結果共得到1,000,000筆之護理記錄語料庫與974個詞的護理記錄辭典,語言模型之語言混淆度相對差異值約為15.541%,屬於值得注意的成果。
The speech recognition technology has improved in last two decades, and some of them were used frequently in health industry of English speaking country. However, multilingual speech recognition is a challenging necessity when it comes to Mandarin based nursing information system. In order to develop the foundation of nursing record entry interface with speech recognition technology, the aim of this study is to build a nursing record corpus and lexicon in Mandarin. We selected electronic nursing record from a medical center in Taiwan as text training data. The data were recorded during Jul, 07 to Mar, 08, included 7 ICU wards and 5 general wards. We used word segmentation and unknown-word extraction system from ACADEMIA SINICA to extract nursing record lexicon and training language models with and without the new lexicon, then calculate the perplexity of language models as evaluation. In this study, we build a 974-words nursing record lexicon. The relative perplexity reduction is 15.541% from the model without nursing record lexicon to the model with 974-words nursing record lexicon.
中文摘要 I
Abstract II
目錄 III
圖目錄 V
表目錄 VI
第一章 緒論 1
1.1 研究背景 1
1.2 研究目的 3
第二章 文獻探討 4
2.1 護理記錄 4
2.1.1 護理記錄之目的與特色 4
2.1.2 護理記錄的方式 5
2.1.3 護理專業詞彙使用於護理記錄之現況 6
2.2 語音辨識之基本架構 7
2.2.1 語言模型 9
2.2.2 辭典 10
2.2.3 中文語音辨識產品 11
第三章 研究方法 12
3.1 建置護理語料庫 14
3.1.1 收集語料 14
3.1.2 語料整理 16
3.2 建置護理記錄辭典 19
3.2.1 擷取新詞 19
3.2.2 新詞收入辭典的判斷 20
3.3 評值方法 21
3.3.1 訓練語言模型 21
3.3.2 語言模型評估準則-語言混淆度(perplexity) 23
第四章 結果 25
4.1 護理語料庫建置結果 25
4.2 護理記錄辭典建置結果 32
4.3 評值結果 33
第五章 討論 38
5.1 護理記錄語料庫與辭典之建置 38
5.1.1 未收入護理記錄辭典詞彙之探討 38
5.1.2 收入護理記錄辭典詞彙之標準 39
5.2 語言模型評值 40
5.2.1 語言混淆度之意義 41
5.3 應用機會 43
5.4 護理專業詞彙 43
5.5 本研究之限制 46
第六章 結論 47
6.1 結論 47
6.2 未來研究建議 47
參考文獻 49
附錄 52
[1]魏玉英、林蓉金,護理記錄缺陷的管理干預,職業與健康,2005,21(12),2081-2082。
[2]林秀如、張育萍、石義方、林美淑(2005),簡化成癮防治科病房護理記錄書寫專案,慈濟護理雜誌,2005,4(1),68-78。
[3]Chang PL, Sheng YS, Sang YY, Wang DW, Developing a wireless speech-and touch- based intelligent comprehensive triage support system. Computers, Informatics, Nursing, 2008 Jan/ Feb, 26(1):1-8.
[4]Thomas W.D., Dorothea M., Norcio A.F., Michael J.D., Nursing acceptance of a speech-input interface: A preliminary investigation, Computers in Nursing, 1994, 12(6):264-271.
[5]Drew Robb, Now We’re Talking, Computerworld, 2006 Oct, p. 25-27。
[6]Justus I., Philip D., Martin W., Free-text data entry by speech recognition software and its impact on clinical routine. Ear, Nose & Throat Journal, 2006 Aug, 85(8):523-527.
[7]L.R. Rabiner and B.H. Juang, Fundamental of speech recognition, New Jersey, Prentice-Hall, Inc.,1993.
[8]王小川,語音訊號處理,台北市:全華,2007。
[9]張碧娟,基於語料庫及辭典精緻化之中文語言模型強化之研究,國立台灣大學碩士論文,2006。
[10]吳妙嬬,以課程錄音為基礎的中英雙語語音辨識之初步研究,國立台灣大學碩士論文,2007。

[11]台大醫院護理部編著,台大護理技術:基技與專技標準,台北市;華杏,1997。
[12]盧美秀等合著,最新基本護理學(上),第6章記錄與病歷,p115-154,台北市;匯華,1997。
[13]Suzanne Bakken Henry et al, A review of major nursing vocabularies and the extent to which they have the characteristics required for implementation computer-based systems, Journal of the American Medical Informatics Association, 1998 Jul/Aug, 5(4):321-328.
[14]馬偉雲、謝佑明、楊昌樺、陳克健,中文語料庫構建及管理系統設計,ROCLING 第十四屆計算語言學研討會論文集,2001。
[15]Chien L.F., PAT-tree-based keyword extraction for Chinese information retrieval, In Proceedings of the 20th annual international ACM SIGIR conference on Research and development in information retrieval, p50-58, 1997.
[16]Pascale Fung, Extracting key terms from Chinese and Japanese texts, In Proceedings of Computer Processing of Oriental Languages, p99-121,1998.
[17]Standley C., Douglas B., Ronald R., Evaluation metrics for language models, In Proceedings of the DARPA Broadcast News Transcription and Understanding Workshop, p275-280, 1998.
[18]Ronald Rosenfeld, Two decades of statistical language modeling: where do we go from here? In Proceedings of IEEE, 2000 Aug, 88(8):1270-1278.
[19]http://healthcare.vocollect.com/index.php/en/roles/nurses
[20]Alexandre Alapetite, Speech recognition for the anaesthesia record during crisis scenarios, International Journal of Medical Informatics, 2008 Jul, 77(7):448-460.
[21]邱艶芬,國際護理作業分類系統在我國護理記錄電子化之適用性評估,行政院衛生署93年度補助計畫成果報告。
[22]Toni G., Ivano A., Carla R., Silvana Q., Mario S., Roberto G., et al, Automated spoken dialogue system for hypertensive patient home management, International Journal of Medical Informatics, 2005 Mar, 74(2-4):159-167.
[23]Hanna S., Tuija L., Barbro B., Helena K., Tapio S., Sanna S., Applying language technology to nursing documents: Pros and cons with a focus on ethics. International Journal of Medical Informatics, 2007 OctVolume 76(S2): S293-S301.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top