研究生(外文):Po-fang Hsu
論文名稱(外文):A HITS-based Semantic Highlight Detection Framework for Live Sports Games using Chinese Social Media
指導教授(外文):Huan Chen
中文關鍵詞:社群媒體運動賽事精華影片註解HITS 演算法
外文關鍵詞:Social MediaSports GameHighlightSemantic AnnotationHITS Algorithm
我們提出一個新穎的框架--基於HITS演算法於華文社群媒體之運動競賽精華片段暨語意萃取框架(HITS-SHiDF),嘗試將留言使用者及影片事件視作一個完全二分圖,並應用被廣為使用於資訊檢索的演算法HITS 演算法來做精彩片段的檢索,並且找出該精彩片段的事件註釋,相較傳統使用時間序列分析上的突波尖峰偵測方式的檢索結果,我們發現我們的檢索方法表現較佳,能不被無意義的留言干擾,如隨意性或跟隨性的發言。

The rise of social networking drives a new wave of revolution in the Internet word, and a large number of users instant message and fast status updating are its characteristic. Thus, in recent years, many studies on social networks have emerged, such as earthquake detection, tracing climate change, sports video highlight detection and so on.
This paper, we propose a new framework for sports game highlights detecting and annotation extraction. In the highlight detection section, we use only the social network text messages, unlike other research using the method with sound / images, not only reduce the computing resources greatly, but also become faster.
We propose a novel framework – A HITS-based Semantic Highlight Detection Framework for Live Sports Games using Chinese Social Media (HITS-SHiDF). In our research, user and highlights are seen as a complete bipartite graph, and using HITS used widely in information retrieval algorithms to do the highlights search.
In the section of highlight semantic annotation, in order to improve the performance of event annotation, we create own segmentation dictionary, using Wikipedia、historical pages of target social media as corpus. In addition, we also propose a new method, trying to enhance the effect on kekphrase extraction.

致謝詞 i
中文摘要 ii
Abstract iii
目錄 iv
附圖目錄 vii
表格目錄 ix
第一章 緒論 1
前言 1
1.2 動機與目的 2
1.3 論文架構 4
第二章 相關研究 6
2.1 現存社群媒體介紹 6
2.1.1 Twitter 6
2.1.2 PTT 7
2.2 事件偵測相關研究介紹 9
2.2.1使用影片本身進行事件偵測 9
2.2.2使用外部資源進行協同事件偵測 10
2.2.3完全不使用影片特徵的事件偵測 11
2.3 語意萃取相關研究介紹 12
2.3.1 TF-IDF 12 TF以及IDF 13
2.3.2 Graph-Based Ranking 15
2.4 斷詞詞庫之建立 17
2.4.1 Field Association(FA) Terms 17
2.4.2 Word2Vec 18
2.5 比較對象論文介紹 21
2.5.1 Moving-threshold burst detection 21
2.5.2 Sliding window 以及Moving-threshold 21
2.5.3 Moving-threshold burst detection核心概念 22
2.5.4 Moving-threshold burst detection 演算法 22
2.5.5 Moving-threshold burst detection 優缺點 23
2.5.6 Event Annotation 24
2.6 HITS (Hyper-link-induced topic search) 25
2.6.1 Hub 以及 Authority 25
2.6.2 HITS演算法 27
第三章 系統架構與方法 32
3.1 系統架構綜述 32
3.2社群媒體資料的搜集 34
3.2基於HITS演算法的精彩賽事事件偵測暨排序模型 36
3.2.1 基於HITS演算法重要事件與重要使用者偵測 37
3.2.2 Power User 以及 Power Event 37
3.2.3事件偵測暨排序演算法 39
3.3 基於TF-IDF的語意萃取暨排序模型 49
3.3.1 社群平台使用者留言內容預處理 50
3.3.2 基於TF-IDF的語意萃取機制 54
3.4 使用Word2Vec模型的段詞詞庫之建立 56
第四章 系統實作與實驗結果 58
4.1 系統開發工具及環境 58
4.2 實驗資料來源 58
4.3 實驗環境與參數設定 60
4.4 事件偵測實驗結果比較 62
4.4.1 事件偵測評估指標(一) 62
4.4.2事件偵測評估指標(二) 77
4.5 語意標註實驗結果比較 80
語意標註評估指標(一) 80
4.5.2語意標註評估指標(二) 85
第五章 結論與未來展望 88
參考文獻 89

