(3.238.36.32) 您好!臺灣時間:2021/02/27 09:28
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:任立斌
研究生(外文):Li-Pin Jen
論文名稱:應用特徵選取進行股價預測與獲利可能性之研究
論文名稱(外文):Research on the Application of Feature Selection for Stock Price Prediction and Profitability
指導教授:林冠成林冠成引用關係
口試委員:洪啟舜張志忠
口試日期:2018-01-26
學位類別:碩士
校院名稱:國立中興大學
系所名稱:資訊管理學系所
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2018
畢業學年度:106
語文別:中文
論文頁數:100
中文關鍵詞:股價預測總經指標技術指標資訊增益支援向量回歸現股當沖
外文關鍵詞:Stock price predictionMacroeconomic indicatorsTechnical pointersInformation GainSupport Vector RegressionDay trading
相關次數:
  • 被引用被引用:4
  • 點閱點閱:342
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:5
  • 收藏至我的研究室書目清單書目收藏:0
本研究以台灣50為研究標的,研究樣本期間自2011/01/01至2015/12/31共計1235筆日資料作為訓練資料集,以及自2016/01/01至2016/12/31共計244筆日資料作為測試樣本進行預測,施以10-fold cross validation進行實驗、驗證效能。並且收集八項基本面分析指標與七項總體經濟指標以及七項技術指標,加上當日開盤價、當日盤中最高價、當日盤中最低價、當日收盤價等共計26項特徵資料,作為輸入變數,進行股價預測與獲利可能性之研究。
我們整合兩種技術的交互使用,提出四種特徵選取的方法(1.ALL:不挑選特徵、2.PCA:主成分分析、3.IG:資訊增益、4.Wrapper:封裝法)和四種預測模型(1.BPNN:倒傳遞神經網路、2.SVR:支援向量回歸、3.KNN:最近鄰居法、4.Random Forest:隨機森林),共組成16種預測模式;並實際以台灣50股價指數來評估模型組合的預測表現,以尋求最適當的預測模型。實證結果發現:有經過特徵選取的模型組合其預測表現較佳,以資訊增益(Information-Gain)模組與封裝法(Wrapper)模組的預測表現最好,二者差異不大;在預測模型的比較上,支援向量回歸(SVR)預測模型的正確率(Accuracy)最高,其次為隨機森林(Random Forest),接著則是倒傳遞神經網路(BPNN),再來則是最近鄰居法(KNN)。
另外,我們使用「現股當沖」的交易模式,根據明日收盤價之預測,輔以上漲「先買後賣」與下跌「先賣後買」之順序原則,制定二種投資策略,並且以實際資料進行測試。測試資料樣本期間自2016/1/1至2016/12/31止,共計244筆之日資料來進行實測,實測結果顯示2016年度之總淨利可以達到正獲利。由以上研究結果證明我們所使用之預測模型與投資策略是有效,並且具有可行性的。
In this study, Taiwan 50 was selected as the research subject. A total of 1235 day data were used as training datasets during the study period from 2011/01/01 to 2015/12/31, and 244 from 2016/01/01 to 2016/12/31 day data as a test sample to predict, apply 10-fold cross validation performance, the experiment. And collected eight basic indicators and seven overall economic indicators and seven technical indicators, combined with the opening day, the highest intraday, the lowest intraday, the closing price of the day a total of 26 characteristics of information, as the input variable, the stock price Research on the Probability and Profitability.
We have integrated the two technologies and proposed four feature selection (1.ALL: no choice of variables, 2.PCA: Principal Component Analysis, 3.IG: Information Gain, 4.Wrapper: Wrapper method) and four (1. BPNN: Back Propagation Neural Network, 2. SVR: Support Vector Regression, 3. KNN: Nearest Neighbor Method, 4. Random Forest: Random Forest) prediction models, which compose 16 kinds of prediction modes; Index to evaluate the prediction performance of the model portfolio to find the most appropriate prediction model. The empirical results show that the prediction performance of the model combination with feature selection is better, and the Information-Gain model and the Wrapper model show the best prediction performance. The difference between the two models is not significant. In the prediction model (SVR) prediction model has the highest accuracy followed by (Random Forest), then (BPNN) and then the (KNN).
In addition, we use the " Day trading " , and according to the prediction of tomorrow''s closing price, supplemented by the principle of the order of "buy first and sell later" and then "sell first and buy later". Based on the actual data carry out testing. Test data sample period from 2016/1/1 to 2016/12/31 , total 244 pen Day data to be measured, measured results show 2016 The total net profit of the year can be achieved. The results from the above research show that the predictive model and investment strategy are effective and feasible.
中文摘要 i
Abstract ii
目次 iii
表目次 vii
圖目次 ix
第一章 緒論 1
1.1. 研究背景 1
1.2. 研究動機 2
1.3. 研究目的 3
1.4. 研究流程 4
第二章 文獻探討 5
2.1. 股市基本面分析 5
2.1.1. 本益比 5
2.1.2. 殖利率 6
2.1.3. 股價淨值比 7
2.1.4. 融資使用率 8
2.1.5. 融券使用率 9
2.1.6. 券資比 10
2.1.7. 成交周轉率 11
2.1.8. 營業收入 12
2.2. 股市總體經濟分析 13
2.2.1. 景氣領先指標綜合指數 13
2.2.2. 消費者物價指數 13
2.2.3. 失業率 14
2.2.4. 一年期定存利率 14
2.2.5. 消費者信心指數 15
2.2.6. 實質有效匯率 15
2.2.7. 台灣M1B貨幣供給額 16
2.3. 股市技術分析指標 17
2.3.1. 相對強弱指標RSI 17
2.3.2. 隨機指標KD 19
2.3.3. 指數平滑異同移動平均線MACD 20
2.3.4. 移動平均線MA 23
2.3.5. 威廉指標W%R 25
2.3.6. 乖離率BIAS 26
2.3.7. 趨向指標DMI 27
2.4. 國內相關研究實證 29
第三章 研究方法 34
3.1. 研究架構 35
3.2. 特徵選取 36
3.2.1. 輸入變數 38
3.2.2. 主成分分析 43
3.2.3. 資訊增益 50
3.2.4. 封裝法 53
3.3. 預測模型 54
3.3.1. 倒傳遞神經網路 54
3.3.2. 支援向量回歸 58
3.3.3. 最近鄰居法 60
3.3.4. 隨機森林 63
3.4. 績效評估方法 65
3.4.1. 平均絕對誤差 65
3.4.2. 均方根誤差 66
第四章 實驗結果 67
4.1. 資料來源 67
4.2. 實驗環境 68
4.3. 實驗結果分析 70
4.3.1. 模型預測結果分析 70
4.3.2. 投資策略結果分析 73
4.4. 實驗結果績效評估 91
第五章 結論與未來研究方向 95
5.1. 結論 95
5.2. 未來研究方向 97
參考文獻 98
[1] 簡壬申,「類神經網路在股票預測之獲利可能性研究-以台灣50成分股為例」,國立雲林科技大學財務金融系,碩士論文,2017年1月
[2] 許雯筆,「應用多元模型於股價指數之預測-以台灣50股價指數為例」,國立高雄應用科技大學金融系金融資訊碩士班,碩士論文,2016年6月
[3] 王威能,「依據技術指標投資臺灣50 ETF及其成分股」,國立台北大學經濟學研究所,碩士論文,2015年6月
[4] 王振璿,「股市投資決策分析之研究-以台灣金融業為例」,龍華科技大學資訊管理系,碩士論文,2015年6月
[5] 牟聖遠,「台灣股市技術分析實證─以KD指標、RSI指標、MACD指標、DMI指標為例」,義守大學資訊管理研究所,碩士論文,2013年12月
[6] 方靜瑜,「台股指數與總體經濟變數之關聯性研究」,國立高雄應用科技大學金融資訊研究所,碩士論文,2013年
[7] 陳鄢貞,「以財務指標及技術指標建構股價預測模型-類神經網路模型之應用」,國立台北大學國際財務金融碩士在職專班,碩士論文,2011年6月
[8] 吳怡慧,「臺灣加權股價指數與總體經濟變數之關聯性研究」,國立中正大學國際經濟研究所,碩士論文,2011年1月
[9] 張愷凌,「景氣循環、總體經濟變數與台灣股價指數的關係性研究」,國立交通大學管理學院碩士在職專班財務金融組,碩士論文,2009年8月
[10]蔡明章,「影響台灣股市波動因素之探討」,國立台北大學國際財務金融碩士在職專班,碩士論文,2009年6月
[11]顏佳欣,「總體經濟指標預測股價指數報酬率之實證研究-STAR模型之應用,國立中山大學經濟學研究所,碩士論文,2006年6月
[12]陳志龍,「運用類神經網路與技術指標預測股票型基金漲跌及交易時機之研究-以臺灣50指數股票型基金為例」,朝陽科技大學資訊管理系,碩士論文,2006年1月
[13]陳國玄,「人工神經網路與統計方法應用於台灣上市電子類股價指數預測與分類之研究」,國立成功大學統計學系,碩士論文,2004年
[14]李惠妍,「類神經網路與迴歸模式在台股指數期貨預測之研究」,國立成功大學高階管理碩士在職專班(EMBA),碩士論文,2003年6月
[15]胡崇銘,「以主成分分析評估基金績效與風險」,國立台灣大學商學研究所,碩士論文,2000年
[16]陳寬裕,「結合遺傳演算法與支援向量迴歸於台灣股票加權指數之預測」,2006年,計量管理期刊vol.3,no.1,page1~18
[17]朱明輝,陳之維,徐憶文,王嘉娟,「應用類神經網路以移動視窗法及單次訓練法預測台灣加權股價指數變動趨勢」,東南科技大學東南學報第三十五期,2010年7月出版,第217-226頁
[18]黃子晉,「運用支持向量機與類神經網路於金融時間序列之預測與比較」,龍華科技大學財務金融系,龍華科技大學學報第三十四期,2014年6月
[19] Lee, T. S., and Chen. (2002). “Investigating the information content of non-cash-trading index Futures using neural network ”.Expert Systems with Applications, Vol.22,No3,pp.225-234.
[20] Tay, F. E. H. and L. Cao(2001)“Application of Support Vector Machines in Financial Time Series Forecasting,” Ome-ga. 29(4):309-317.
[21] Young Sook Moon and George R. Franke, (2000), “Cultural Influences on Agency Practitioners’ Ethical Perceptions: A comparison of Korea and the U.S.,” Journal of Advertising, 29(Spring), 51-65.
[22] Zhang,G.,Patuwo,B.E.,and Hu.(1998).“Forecasting with artificial neural networks:The state of the art”.International Journal of Forecasting , Vol.14, No.1, pp.35-62
[23] Fan, Z.,H. Masui, I. Atlas, and J. Mendelsohn. (1993),"Blockade of epidermal growth factor receptor function by bivalent and monovalent fragments of 225 anti-epidermal growth factor receptor monoclonal antibodies."Cancer Res.53:4322-4328
[24] Jacobs, Bruce I., and Kenneth N. Levy.(1989)“The Complexity of the Stock Market.” Journal of Portfolio Management, vol. 16, no. 1 (Fall):19–27.
[25] Rumelhart, David E.; Hinton, Geoffrey E., Williams, Ronald J.(1986) Learning representations by back-propagating errors. Nature. 8 October 1986, 323 (6088): 533–536.
[26] Fama, Eugene F. (1970). “Efficient Capital Markets: A Review of Theory and EmpiricalWork.” Journal of Finance 25:383–17.
[27] Hanson, A. W., M. L. Applebury, J. E. Coleman and H. W. Wyckoff, (1970) Studies on single crystal of Escherichia coli alkaline phosphatase. J. Biol. Chem. 245:4975–4976.
[28] Cover, T. M. & Hart, P. E. (1967). Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 13(1), 21-27.
[29] https://zh.wikipedia.org/ 維基百科網站
[30] http://www.cmoney.tw/ CMoney網站
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關點閱論文
 
系統版面圖檔 系統版面圖檔