跳到主要內容

臺灣博碩士論文加值系統

(54.83.119.159) 您好!臺灣時間:2022/01/17 10:10
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:方策民
研究生(外文):Ce-Min Fang
論文名稱:電視新聞文稿之研究
論文名稱(外文):The Study of TV News Text
指導教授:傅心家傅心家引用關係
指導教授(外文):Hsin-Chia Fu
學位類別:碩士
校院名稱:國立交通大學
系所名稱:資訊工程系
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2002
畢業學年度:90
語文別:中文
中文關鍵詞:關鍵詞相關新聞文稿配對電視新聞多媒體中文斷詞
外文關鍵詞:bigram matchingkeyword extractionrelated newsTV newsmultimediaChinese words segmentation
相關次數:
  • 被引用被引用:5
  • 點閱點閱:1218
  • 評分評分:
  • 下載下載:323
  • 收藏至我的研究室書目清單書目收藏:3
本篇論文的主要目的,在於研究如何將文件處理技術應用在電視新聞內容分析上,精確而有效地針對以多媒體型式呈現的電視新聞做描述或索引,
方便使用者在已建構好的電視新聞檢索系統中做瀏覽的動作。我們使用bigram評分的方法,將電視新聞故事與文稿做配對的工作。當配對完成之後,更進一步針對文稿做關鍵詞的萃取,這個部份利用了詞庫比對和統計分析這兩種常見的方法做搭配。最後根據每則新聞故事所萃取出來的關鍵詞,建立每則新聞故事和其他新聞故事間的聯結,讓使用者能夠做主題式的瀏覽。
This thesis focuses on how to apply the text processing techniques to TV content analysis, then, we could precisely and efficiently describe or index TV news programs in multimedia form to facilitate user''s browsing among TV news stories. We use bigram evaluation to match the TV news story and its
corresponding text. When text is matched, lexicon matching and
statistical analysis are used together to extract keyphrases from news text. Finally, according to the keyphrases extracted from each TV news story, we could construct the link among TV news stories, hence, user can browse various TV news story
thematically.
第一章 導論
1.1 前言
1.2 研究背景及目標
1.3 章節介紹
第二章 中文文件分析之相關研究
2.1 PAT-Tree在中文文件處理上的應用
2.1.1 PAT-Tree
2.1.2 使用PAT-Tree做關鍵詞的萃取
2.2 相關文件搜尋
2.2.1 延伸查詢
第三章 電視新聞文稿分析
3.1 新聞與文稿的配對
3.1.1 文稿的前置處理
3.1.2 新聞與文稿的配對
3.2 文稿中關鍵詞的萃取
3.2.1 詞庫的建立
3.2.2 斷詞的流程與分析
3.2.3 建立統計分析數據
3.2.4 文句結構分析
3.3 建立新聞間的關聯性
3.3.1 權重的分配
3.3.2 相關性計算模型
第四章 實驗數據與分析
4.1 新聞與文稿配對實驗
4.1.1 實驗資料來源
4.1.2 評量參數
4.1.3 實驗結果與分析
4.2 關鍵詞萃取實驗
4.2.1 實驗資料來源
4.2.2 評量參數
4.2.3 實驗結果與分析
4.3 相關新聞連結實驗
4.3.1 實驗資料來源
4.3.2 評量參數
4.3.3 實驗結果與分析
第五章 結論與未來工作
電視新聞檢索系統. http://nn.csie.nctu.edu.tw/NewsQuery/main.asp 交通大學資訊工程學系 多媒體與神經網路實驗室.
鍾文豪. 電視新聞內容分類與索引之研究.
交通大學資訊工程研究所. 民國90年7月.
富博超. 以語者辨識為基礎的主播認定之研究.
交通大學資訊工程研究所. 民國90年7月.
林家弘. 應用MPEG視訊分析於電視新聞分段之研究.
交通大學資訊工程研究所. 民國90年7月.
鄭士賢. 高斯混合模型的學習與其在語者識別上的應用.
交通大學資訊工程研究所. 民國91年7月.
陳克健,陳正佳,林隆基. 中文語句分析的研究-斷詞與構詞.
中央研究院資訊所技術報告. TR86-004, 1986.
張俊盛,陳志達,陳舜德. 限制式滿足及機率最佳化的中文斷詞方法.
中華民國第四屆計算機語言學研討會論文集, 1991.
Sporat R., Shih C. "A Statistical Method for Finding Word Boundaries in Chinese Text".
Computer Processing of Chinese and Oriental Languages, Vol.4, No.4, pp.336-351, 1990.
Chen, K. J., Liu, S. H. "Word identification for mandarin Chinese sentences".
Proceedings of the Fifteenth International Conference on Computational Linguistics, Nantes, pp.101-107, 1992.
Lee-Feng Chen. "PAT-Tree-Based Keyword Extraction for Chinese Information Retrieval".
the 20th Annual International ACM-SIGIR Conference on Research and Development in Information Retrieval Philadelphia, pp.50-58, PA, USA, July 1997.
陳克健,黃居仁. 訊息為本的格位語法-一個適用於表達中文的語法模式.
中華民國第二屆計算語言學研討會論文集, pp.95-120, 1989.
中央研究院資訊科學研究所中文詞知識庫小組. 技術報告 93-05 中文詞類分析.
台北 南港 中央研究院, June 1993.
D. R. Morrison. "PATRICIA-Practical Algorithm to Retrieve Information Coded in Alphanumeric".
Journal of the ACM, Vol.15, No.4, pp.514-534, Oct 1968.
Chia-Hui Chang, Ching-Chi Hsu. "Enabling Concept-Based Relevance Feedback for Information Retrieval on the WWW".
IEEE Transactions on Knowledge and Data Engineering, Vol.11, No.4, July/August 1999.
Jinxi Xu, W.Bruce Croft. "Improving the Effectiveness of Information retrieval with Local Content Analysis".
ACM Transactions on Information Systems Vol.18, No.1, pp.79-112, ACM, January 2000.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top