研究生(外文):Ju-Yun Yang
論文名稱(外文):Using Text Mining for Coal Trend Forecast: A Case Study of China Market
指導教授(外文):Chao-Chang Chiu
外文關鍵詞:Text Mining,Forecast,Coal Trends,Energy
Coal, oil, natural is the world''s three most important energy, and oil has been used the longest time. From 1999 to 2009, the consumption of coal, oil, and gas has grown 45.77%, 10.24%, and 26.61%, and coal consumption growth most significant. China has the largest coal production in the world, and is has great demand for coal. According to the Chinese Ministry of Land and Resource Department, from 2000 to 2009 China''s coal consumption is almost equal to its coal production. Coal is the most important energy in China, 70% of China''s coal used in power industry, and 83% china’s thermal power use coal as fuel. Obviously, the fluctuations of coal price not only affect to electricity price, but also affect end-product prices and China''s economic development. In this study, we use China’s coal price, related news, and international indicator to forecast China''s coal trend. The experimental shows that we can achieve 73.91% accuracy when we use news information only, 61.96% accuracy when use indicator data only, and when we use news information and indicator data, the forecast model could achieve 72.53% accuracy.

書名頁 i
論文口試委員審定書 ii
授權書 iii
中文摘要 iv
英文摘要 v
誌謝 vi
目錄 vii
表目錄 viii
圖目錄 ix
第一章、 緒論 1
1.1 研究背景 1
1.2 動機與目的 3
第二章、 文獻探討 6
2.1 煤炭 6
2.2 文字探勘技術 8
2.3 能源預測 9
第三章、 研究方法 16
3.1 網頁資料擷取 16
3.2 資料標記 18
3.3 資料前處理 19
3.4 建立三種預測模型 21
3.5 預測結果評估 26
第四章、 研究實驗 27
4.1 資料描述 27
4.2 實驗結果 28
第五章、 討論 35
第六章、 結論與未來研究 36
第七章、 參考文獻 38

表一、ICTCLAS漢語分詞系統斷詞結果 20
表二、同義詞合併示意 21
表三、預測評估表 26
表四、實驗資料分布表 28
表五、指數列表 28
表六、特徵詞表 29
表七、指數漲跌幅資料建立預測模型 30
表八、新聞詞頻資料建立預測模型 31
表九、指數漲跌幅資料建立預測模型 32
表十、結合指數與新聞資料建立預測模型 33
表十一、結合二種資料模型之參數設定 33
表十二、結合指數與新聞資料建立預測模型(加入GA調整特徵詞權重) 34
表十三、加權正確率預測結果(新聞詞頻資料) 35

圖一、世界三大能源歷年產量及消費量(1965-2009) 1
圖二、中國煤炭產量及消費量 2
圖三、中國建設發展、煤炭資源與電力能源關係圖 3
圖四、中國煤炭、石油、天然氣消費趨勢與比較圖 4
圖五、2004年中國一次性能源構成圖 7
圖六、中國各煤區煤炭資源百分比 8
圖七、動力煤價格趨勢預測流程 16
圖八、新聞群組合併示意圖 18
圖九、價格漲跌幅計算方式 19
圖十、指數資料前處理流程 19
圖十一、新聞資前處理流程 19
圖十二、建立模型用指數資料示意 22
圖十三、每日權重示意圖 22
圖十四、新聞詞頻資料建立預測模式資料及權重示意圖 23
圖十五、結合指數類別及新聞詞頻資料建立預測模式資料及權重示意圖 24
圖十六、GA動態調整權重流程圖 25

