跳到主要內容

臺灣博碩士論文加值系統

(35.175.191.36) 您好!臺灣時間:2021/07/30 11:47
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:蔡宜芷
研究生(外文):Yi-Chih Tsai
論文名稱:在串流使用記錄中進行趨勢偵測與分析事件成因組合
論文名稱(外文):Trending Event Detection and Explanation on Streaming Log Data
指導教授:徐宏民
口試委員:孫民李宏毅陳文進
口試日期:2015-07-21
學位類別:碩士
校院名稱:國立臺灣大學
系所名稱:資訊網路與多媒體研究所
學門:電算機學門
學類:網路學類
論文種類:學術論文
論文出版年:2015
畢業學年度:103
語文別:英文
論文頁數:22
中文關鍵詞:趨勢事件事件偵測時間序列類別資料串流資料大型資料視覺化視覺分析
外文關鍵詞:Trending eventevent detectiontime-seriescategorical datastreaming datalarge-scale visualizationvisual analytics
相關次數:
  • 被引用被引用:0
  • 點閱點閱:96
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
隨著視覺化網頁技術以及資料分析語言的興起,各式各樣的視覺化圖表或是系統資源充斥,我們很容易取得多樣化的視覺分析工具。但是現今仍然沒有一個工具或是圖表能夠讓使用者容易的找出存在於串流使用資料中的趨勢事件以及這個事件的成因組合。
在這篇論文中,我們對這個議題提出了可以應用在百萬筆資料規模上的解決方法,並使用串流音樂服務的資料為例。我們想在串流音樂的使用記錄中找出某個時間點的趨勢事件,例如:某歌手的點播率在這個時間點越來越紅,原因為某群使用者用某個平台點播。找出這樣的事件就是我們的目的。但礙於我們的資料為類別型的資料(而非數值型,例如說:歌手的名字),找出這樣的事件成因組合其實是非常困難的。我們無法直接使用已開發成熟的各種數值型的學習方法來解決我們想到的問題。所以我們提出一個學習方法和其結果瀏覽介面去揭露這個學習方法所學到的東西。而且這個方法不只可以應用在我們的音樂服務範例上,也可以應用在其他時間型的類別資料,像是社群網站中的主題標籤。
首先我們用``trending pool''這個操作去找出有用的項目以減少之後的記憶體和計算時間用量。再來我們使用sparse coding這個學習方法去找出重要的事件成因組合而非傳統的窮舉法,或是人工指定組合的方法。除了以上的貢獻之外,我們還做了視覺介面設計,用來方便觀察分析每個時段的事件成因組合,並用這個介面找出了一些有趣的使用者聆聽音樂的習慣模式。

Although many visualization tools provide us plenty of ways to view the data, users can not use them to easily find the trending events and their explanation from the million-scale data. In this work, we address the issue by leveraging the real music streaming log data as an example to help users better understand a million-scale dataset. Trending event explanation turns out to be challenging when it comes to categorical log data. Therefore, we propose to use a learning-based method with an interface design to uncover the trending event compositions for time-series categorical log data, which can be extend to other datasets, e.g., the hashtags in social media. First, we perform ``trending pool'' operation to save the memory and time cost. Second, we apply sparse coding to learn important trending candidate combination sets instead of traditional brute-force way or manual investigation for generating combinations. Besides the contributions above, we also observe some interesting user behaviors by exploring detected trending candidate combinations visually through our interface.

Contents
誌謝. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ii
摘要. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii
Abstract . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv
0.0.1 Keywords . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv
1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1
1.1 Trending Traffics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Streaming Data Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Problem Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2 Related Work . . . . . . . . . . . . . . . . . . . . . 4
2.1 Trending Detection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.2 Event Explanation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.2.1 Limitations of Prior works . . . . . . . . . . . . . . . . . . . . . 4
3 Technical Details . . . . . . . . . . . . . . . . . . . . . 6
3.1 Trending Candidate Detection . . . . . . . . . . . . . . . . . . . . . . . 6
3.1.1 Trending Pool . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.1.2 Trick: Entropy Weight . . . . . . . . . . . . . . . . . . . . . . . 8
3.2 Event Composition Discovering . . . . . . . . . . . . . . . . . . . . . . 9
3.2.1 Sparse Coding . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3.3 System Summarization: with Visualization . . . . . . . . . . . . . . . . 10 v
4 Experiment Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
4.1 Datasets and Implementation . . . . . . . . . . . . . . . . . . . . . . . . 12
4.2 Trending Candidate Evaluation . . . . . . . . . . . . . . . . . . . . . . . 12
4.2.1 Pseudo Ground Truth . . . . . . . . . . . . . . . . . . . . . . . . 13
4.2.2 Pilot Experiment Flow . . . . . . . . . . . . . . . . . . . . . . . 13
4.2.3 Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
4.3 Trending Event Results . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
4.4 User Behavior Findings . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
4.4.1 Windows Platform . . . . . . . . . . . . . . . . . . . . . . . . . 16
4.4.2 Users of 1970 to 1989 . . . . . . . . . . . . . . . . . . . . . . . 17
4.4.3 Mobile Platforms . . . . . . . . . . . . . . . . . . . . . . . . . . 17
5 Visualization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
5.1 Visualization Layout . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
5.2 Design Factors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
6.1 Contributions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
6.2 Future Works . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Bibliography . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

[1] S. Roy and D. Suciu. A formal approach to finding explanations for database queries. ACM SIGMOD, 2014.
[2] J. Wang, J. Yang, K. Yu, F. Lv, T. Huang, and Y. Gong. Locality-constrained linear coding for image classification. In Computer Vision and Pattern Recognition (CVPR), 2010 IEEE Conference on, pages 3360–3367. IEEE, 2010.
[3] C.-C. Wu, T. Mei, W. H. Hsu, and Y. Rui. Learning to personalize trending image search suggestion. ACM SIGIR, 2014.
[4] E. Wu and S. Madden. Scorpion: Explaining away outliers in aggregate queries. VLDB, 2013.


QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關論文
 
無相關期刊
 
無相關點閱論文