跳到主要內容

臺灣博碩士論文加值系統

(44.222.131.239) 您好!臺灣時間:2024/09/08 21:21
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:謝明穎
研究生(外文):Hsieh, Ming-Ying
論文名稱:運用機器學習方法建構房價預測視覺化平台
論文名稱(外文):Building a Visualization Platform for Predicting Estate Valuation by Machine Learning Methods
指導教授:謝邦昌謝邦昌引用關係張光昭張光昭引用關係
指導教授(外文):Shia, Ben-ChangChang, Kuang-Chao
口試委員:鄭宇庭楊志清
口試委員(外文):Cheng, Yu-TingYang, Chih-Ching
口試日期:2017-06-10
學位類別:碩士
校院名稱:輔仁大學
系所名稱:統計資訊學系應用統計碩士班
學門:數學及統計學門
學類:統計學類
論文種類:學術論文
論文出版年:2017
畢業學年度:105
語文別:中文
論文頁數:84
中文關鍵詞:實價登錄機器學習深度學習類神經網路支持向量迴歸隨機森林視覺化
外文關鍵詞:Actual Price RegistrationMachine LearningDeep LearningArtificial Neural NetworkSupport Vector RegressionRandom ForestVisualization
相關次數:
  • 被引用被引用:9
  • 點閱點閱:1607
  • 評分評分:
  • 下載下載:196
  • 收藏至我的研究室書目清單書目收藏:0
買房一直是多數人的人生目標,因為房子保值的特性,愈來越多人傾向於投資不動產,傳統上,因為沒有像實價登錄這種公開的資料,所以要進行不動產估價必須依靠鑑價師,然而,不動產個別估價成本較高,以致於發展出大量估價法,利用大量的資料來推估每個不動產的價值。現今,有許多的方法被利用於自動化不動產估計,從原本的複迴歸模型到現在的機器學習方法,方法不斷的成長,但是目前並沒有一套方法可以精確的預測國內不動產之價格。因此,本研究首先利用近兩年的實價登錄資料,此資料擁有交易標的之基本特性;並整合政府的設施開放資料,透過此兩份資料分別探討設施距離、設施數量以及房屋基本特性對於房價的影響程度。最後以近年來迅速成長的深度學習方法估計不動產之價格,並且與其餘機器學習方法中之類神經網路方法、支持向量迴歸方法、隨機森林方法三種方法進行比較;實證分析結果顯示,若是在有限的時間及電腦設備的情況下,隨機森林方法下的預測結果擁有較良好的預測能力。再以最佳方法下預測結果較優良之模型作為建置R-Shiny平台的基礎,讓使用者輸入交易標的資料後進行估計,迅速了解周圍房價行情。並且透過視覺化的方式呈現,更加了解其物件周圍環境狀況。
Houses has been the goal of most people's life, because of the hedging characteristics of houses, more and more people tend to invest in real estate. Traditionally, there is no public information for the price of every houses, so the real estate valuation must rely on the appraiser. Because the real estate valuation costs lots of money, mass appraisal which through of lots of information to estimate the value of each real estate has been developed.
Today, there are many ways to be used in automated estimation of real estate, from the original complex regression model to the current machine learning methods, methods continues growing, but there is no methods can accurately predict the domestic real estate prices.
First, this study use the data from Actual Price Registration for last two years, and the data has basic characteristics of object of transaction. Second, not only the data from Actual Price Registration this study used, the author also integrate the data from Open Government Data. Through the combination data, explore the extent of facilities distance, the number of facilities, the basic characteristics of housing for the impact of housing prices
At last, through of comparing the results of emerging deep learning method and the rest of the machine learning methods such as the method of neural network, support vector regression and random forest method. Results of the empirical analysis show that the predicted results under the random forest method have better predictive ability in the case of limited time and computer equipment. Then use this method to create the best model, and be a foundation for building a platform by R-shiny. Let users can type multiple standards for houses, and then the platform can easily , quickly but correctly show the value of each real estate around where users choose with visualization.

第壹章 緒論 1
第一節 研究背景與動機 1
第二節 研究目的 3
第三節 研究流程 5
第貳章 文獻探討 6
第一節 影響不動產價格之因子 6
第二節 不同方法基於房價預測 8
第參章 研究方法 10
第一節 研究架構 10
第二節 資料來源及介紹 11
第三節 研究方法說明 12
第四節 實價登錄模型建置流程 29
第肆章 實證分析 31
第一節 資料預處理 31
第二節 資料變數介紹 33
第三節 模型建置及評估 35
第四節 實證結果 50
第伍章 結論 59
第一節 研究結論 65
第二節 平台介紹 59
第三節 研究限制及建議 67
參考文獻 68
附錄一 台北市實價登錄變數敘述(連續型變數) 72
附錄二 台北市實價登錄變數敘述(類別型變數) 73
附錄三 新北市實價登錄變數敘述(連續型變數) 74
附錄四 新北市實價登錄變數敘述(類別型變數) 75
附錄五 台北市環境設施變數(最短直線距離) 76
附錄六 台北市環境設施變數(五百公尺內數量) 78
附錄七 新北市環境設施變數(最短直線距離) 80
附錄八 新北市環境設施變數(五百公尺內數量) 82
附錄九 深度神經網路變數重要性圖 84
中文文獻
王進祥(2012)。實價登錄與稅制改革。土地問題研究季刊,11(3),98-108。
江穎慧(2009)。不動產自動估價與估價師個別估價之比較-以比較法之案例選取、權重調整與估值三階段差異分析。住宅學報,18(1),39-62。
李永展、何紀方(1995)。台北地方生活圈都市服務設施之鄰避效果。都市與計畫,23(1),95-116。
奉國和。(2011)。SVM 分類核函數及參數選擇比較。電腦工程與應用,47(3),123-124。
林祖嘉、馬毓駿(2007)。特徵價格法大量估價法在台灣不動產市場之應用。住宅學報,16(2),1-22。
邱司杰(2014)。基於實價登錄的房價模型研究。國立交通大學資訊科學與工程研究所碩士論文,新竹市。
邱美甄、鄧家駒、張光昭、邱俊誠(2013)。台灣地區各城市房屋住宅消費力探討。數據分析,8(6),41-72。
柯柏戎(2012)。都會區購屋者對自用住宅環境設施需求之研究。國立中央大學營建管理研究所碩士論文,桃園市。
陳時仲(2015)。隨機森林模型效力評估。國立交通大學統計學研究所碩士論文,新竹市。
陳樹衡、郭子文、棗厥庸(2007)。以決策樹之迴歸樹建構住宅價格模型-臺灣地區之實證分析。住宅學報,16(1),1-20。
楊宗憲、蘇倖慧(2011)。迎毗設施與鄰避設施對住宅價格影響之研究。住宅學報,20(2),61-80。
趙志勇、王峰、李元香(2014)。基於深度學習的股票市場預測。中國科技論文線上。
賴碧瑩(2007)。應用類神經網路於電腦輔助大量估價之研究。住宅學報,16(2),43-65。
簡淑芬(2012)。不動產估價模型之研究-以臺中市為例。逢甲大學財稅學系碩士在職專班碩士論文,台中市。
蘇高玄(2011)。特徵選起方法於房價預測分析的應用,計量管理期刊,8(2),35-42。

英文文獻
Basak, D., Pal, S., & Patranabis, D. C. (2007). Support vector regression.Neural Information Processing-Letters and Reviews, 11(10), 203-224.
Berry, M. J. & G. Linoff (1997). New York: John Wiley & Sons, Inc.. Data Mining Techniques: For Marketing, Sales, and Customer Support.
Breiman, L. (2001). Random forests. Machine learning, 45(1), 5-32.
Breiman, L.(2002). Manual On Setting Up, Using, And Understanding Random Forests V3.1.
Chih-Wei Hsu, Chih-Chung Chang & Chih-Jen Lin (2016). A Practical Guide to Support Vector Classification.
Cortes, C., & Vapnik, V. (1995). Support-vector networks. Machine learning, 20(3), 273-297.
Garson, D. G. (1991). Interpreting neural network connection weights.
Gedeon, T. D. (1997). Data mining of inputs: analysing magnitude and functional measures. International Journal of Neural Systems, 8(02), 209-218.
Hinton, G. E., & Salakhutdinov, R. R. (2006). Reducing the dimensionality of data with neural networks. science, 313(5786), 504-507.
Hinton, G. E., Osindero, S., & Teh, Y. W. (2006). A fast learning algorithm for deep belief nets. Neural computation, 18(7), 1527-1554.
Hornik, K., Stinchcombe, M., & White, H. (1989). Multilayer feedforward networks are universal approximators. Neural networks, 2(5), 359-366.
LeCun, Y. A., Bottou, L., Orr, G. B., & Müller, K. R. (2012). Efficient backprop. In Neural networks: Tricks of the trade (pp. 9-48). Springer Berlin Heidelberg.
McCulloch, W. S., & Pitts, W. (1943). A logical calculus of the ideas immanent in nervous activity. The bulletin of mathematical biophysics, 5(4), 115-133.
Rivas-Perea, P., Cota-Ruiz, J., Chaparro, D. G., Venzor, J. A. P., Carreón, A. Q., & Rosiles, J. G. (2012). Support vector machines for regression: a succinct review of large-scale and linear programming formulations.
Rumelhart,Hinton,Williams.(1986).Learning representations by back-propagation. Nature 323,533-536
Wong, K. C., So, A. T., & Hung, Y. C. (2002). Neural network vs. hedonic price model: appraisal of high-density condominiums. In Real Estate Valuation Theory (pp. 181-198). Springer US.

網路資料
https://cran.r-project.org/web/packages/available_packages_by_name.html
http://speech.ee.ntu.edu.tw/~tlkagk/courses/MLDS_2015_2/Lecture/DNN%20(v4).pdf
https://h2o-release.s3.amazonaws.com/h2o/rel-slater/9/docs-website/h2o-docs/booklets/DeepLearning_Vignette.pdf
https://www.yungching.com.tw/
http://www.nra.com.tw/
http://www.sinyi.com.tw/?gclid=CL2Mk7qOtdQCFUsEKgod5mQCug&gclsrc=aw.ds

QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top