跳到主要內容

臺灣博碩士論文加值系統

(100.26.176.111) 您好!臺灣時間:2024/07/16 14:36
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:蕭博元
研究生(外文):HSAIO, PO-YUAN
論文名稱:使用關鍵字於深度強化學習中對應股價預測
論文名稱(外文):Deep Reinforcement Learning For Stock Price Prediction With Keywords In Google Trends
指導教授:尤信程
指導教授(外文):YOU, SHING-CHERN
口試委員:尤信程吳牧恩黃文吉
口試委員(外文):YOU, SHING-CHERNWU, MU-ENHWANG, WEN-JYI
口試日期:2022-07-24
學位類別:碩士
校院名稱:國立臺北科技大學
系所名稱:人工智慧與大數據高階管理雙聯碩士學位學程
學門:電算機學門
學類:電算機應用學類
論文種類:學術論文
論文出版年:2022
畢業學年度:110
語文別:中文
論文頁數:39
中文關鍵詞:深度強化學習美國股市Google 收尋趨勢
外文關鍵詞:Deep reinforcement learningUS stock marketGoogle Trends
相關次數:
  • 被引用被引用:0
  • 點閱點閱:188
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
深度學習是在機器學習中對資料進行為學習的演算法,通過機器算法不斷學習和改進。所以本研究目標是利用金融市場的關鍵及股市的每周股票的交易紀錄進行學習分析未來股市的漲跌方向,達到風險最小化,利益最大化的目標。 Open AI出品一系列深度學習 (Deep Reinforcement Learning)的演算法。而本研究選用 Proximal Policy Optimization(PPO)模型,此模型補僅有很好的連續控制問題且相較於 Trust Region Policy Optimization(TRPO)模型更加易於實現。本研究會將每周股票交易數據及美國在有關金融市場的關鍵字收尋熱度進行深度學習, 並在考慮到 PPO2中的獎勵機制進而判斷未來股價趨勢並決定後續交易策略。研究中以美國股市歷史資料進行學習及模擬,因此次選用關鍵字參考資料為 Google Tend的最久資料為 2004年開始,故此次選擇測試及分析模擬的時間最早選至 2004開始至 2021年底,在這 18年間包含 2007到 2008環球經融危機和 2019到 2020全球冠狀病毒疫情影響所產生的重大經融危機。而在關鍵字選擇上則選擇與股市相關的關鍵字進行分析如通貨膨脹、升息等會影響股價的關鍵字。本研究最後選用 2017年 5月 1日至 2022年 4月 30日的資料進行研究,最後研究結果加入關鍵字相對於未加入及年成率在第 4並沒有太明顯的差異,但第 5年所測試的結果很有效的避開下跌的虧損,並且還有獲利。
Deep learning is an algorithm that learns from data in machine learning, and continuously learns and improves through machine algorithms. Therefore, the goal of this research is to use the key of the financial market and the weekly stock trading records to study and analyze the future direction of the stock market's rise and fall, to minimize risks and maximize benefits.Open AI produces a series of algorithms for Deep Reinforcement Learning. In this study, the Proximal Policy Optimization (PPO) model is used, which complements the ongoing control problem well and is easier to implement than the Trust Region Policy Optimization (TRPO) model. This research will conduct deep learning on weekly stock trading data and keyword search popularity in related financial markets in the United States, and take into account the reward mechanism in PPO2 to determine future stock price trends and subsequent trading strategies.In the research, the historical data of the U.S. stock market is used for study and simulation. Therefore, the longest data for the selected keyword reference data is Google Tend since 2004. Therefore, the earliest time for testing and analysis simulation is selected from 2004 to the end of 2021. These 18 years include the 2007-2008 global financial crisis and the 2019-2020 global coronavirus epidemic that resulted in major financial crises. In terms of keyword selection, keywords related to the stock market are selected for analysis, such as inflation, interest rate hikes, and other keywords that will affect the stock price.

摘 要 i
ABSTRACT ii
誌 謝 iii
目 錄 iv
圖目錄 vi
第一章 緒論 1
1.1 研究動機 1
1.2 論文組織架構 2
第二章 研究背景與相關知識 3
2.1 美國股市 3
2.2 經濟因素 4
2.3 Google 搜尋趨勢 5
2.4 強化學習(Reinforcement Learing) 5
2.4.1 強化學習簡介 6
2.4.2 Proximal Policy Optimization 6
2.4.3 PPO2 7
2.5 文獻探討 8
2.5.1 Hong 的以DQN演算法訓練ETF之交易代理人 8
2.5.2 Chen的DQN自動交易系統 8
2.5.3 KU的近端策略最佳化演算法探索率之動態調整以減緩獎勵值快速降低問題 8
第三章 研究與作法 9
3.1 環境 9
3.1.1 股票資料配置 10
3.1.2 狀態 12
3.1.3 動作 12
3.1.4 獎勵 13
第四章 實驗 14
4.1 電腦硬體設備 14
4.2 實驗瀏覽 15
4.3 股票年度趨勢統計 15
4.4 使用交易參數下代理人的績效表現 16
4.5 加入關鍵字參數後的績效表現 17
4.6 實驗結論 18
第五章 結論與未來展望 20
5.1 結論 20
5.2 未來展望 20
參考文獻 22
附錄A研究相關圖表 23
1.各股趨勢走勢圖 24
2.各關鍵字區間收尋熱度 36



[1] "台灣證券交易所,"[Online].Available: https://www.twse.com.tw/zh/.[Accessed 5 6 2022].
[2] "MBA智庫百科,"[Online].Available: https://wiki.mbalib.com/.[Accessed 5 6 2022].
[3] 工藤舊一,"強化學習入門(三) : PPO、PPO2、TRPO算法思想,"[Online].Available: https://blog.csdn.net/weixin_45459911/article/details/105580804.[Accessed 5 6 2022].
[4] 洪紹晏,"Training an ETF Trading Agent with Deep Q-Learning, "國立臺北科技大學資訊工程系碩士學位論文,2019.
[5] Chen, Fei-Ting.," Convolutional Deep Q-learning for ETF Automated Trading System, "國立政治大學應用數學系碩士學位論文,2017.
[6] 古兆瑋,"Dynamic Adjustment of Exploration Rate for Proximal Policy Optimization Algorithm to Relief Fast Reward Decline Problem, "國立臺北科技大學資訊工程系碩士學位論文,2021.
[7] "TinkMarkets,"[Online].Available: https://www.thinkmarkets.com/.[Accessed 10 4 2022].
[8] "Yahoo Finance,"[Online].Available: https://finance.yahoo.com/.[Accessed 20 4 2022].
[9] "Google Trend,"[Online].Available: https://trends.google.com..[Accessed 20 4 2022]

電子全文 電子全文(網際網路公開日期:20270630)
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top