跳到主要內容

臺灣博碩士論文加值系統

(54.161.24.9) 您好!臺灣時間:2022/01/17 12:12
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:曾健逢
研究生(外文):Chien-Feng Tseng
論文名稱:大量資料集之線性迴歸模式的估計問題
論文名稱(外文):Estimation for Linear Regression Model on Large Data Sets
指導教授:林共進林共進引用關係任眉眉任眉眉引用關係
指導教授(外文):Dennis K. J. LinMei-Mei Zen
學位類別:碩士
校院名稱:國立成功大學
系所名稱:統計學系碩博士班
學門:數學及統計學門
學類:統計學類
論文種類:學術論文
論文出版年:2002
畢業學年度:90
語文別:中文
論文頁數:59
中文關鍵詞:參數估計大量資料集迴歸分析
相關次數:
  • 被引用被引用:17
  • 點閱點閱:1388
  • 評分評分:
  • 下載下載:562
  • 收藏至我的研究室書目清單書目收藏:5
資訊科技的重大變革使得資料的蒐集在過去十年間變的更為便利與普遍,現行資料庫的儲存不但可能包含了上百個欄位,而且資料量可能更多達數百億筆。在面對這麼大量的資料集下,傳統的統計方法必須藉由適度的改良與修正,使得資料分析的目的能夠順利完成。根據Li, Lin and Li[5]一文的概念,本研究針對大量資料集提出了估計線性迴歸模式參數的方法。藉由本研究方法,我們可以很容易地計算得到大量資料集的迴歸參數估計值,而且在常態誤差的假設下,本方法所提出的估計量是迴歸參數的不偏估計量。再者,數值分析的結果顯示該估計量的變異數與最小平方法估計量的變異數相當,而且當樣本數愈大,研究方法與最小平方法的估計結果會愈接近。此外,模擬的結果也呈現本研究方法在其他線性迴歸模式的估計問題上亦有不錯的表現。最後的實例分析則說明了本方法在實際應用上的優勢與便利。
一、 研究動機與背景 …………………………………………… 1
二、 迴歸分析回顧 ……………………………………………… 3
2.1 迴歸模型簡述 ………………………………………… 3
2.2 簡單線性迴歸模型 …………………………………… 6
2.2.1 模型與特性 ………………………………………
2.2.2 參數估計 ………………………………………… 7
2.2.3 殘差與變異數σ的估計 ………………………… 9
2.3 常態誤差線性迴歸模型 ……………………………… 10
2.3.1 模式與參數估計 ………………………………… 11
2.3.2 參數的抽樣分配 ………………………………… 12
三、 文獻探討 …………………………………………………… 14
3.1 概念與方法 …………………………………………… 15
3.2 母體平均數與標準差的估計 ………………………… 16
3.3 信賴區間與假設檢定 ………………………………… 17
3.4 模擬驗證 ……………………………………………… 18
3.5 討論 …………………………………………………… 20
四、 研究方法與性質探討 ……………………………………… 21
4.1 研究方法 ……………………………………………… 21
4.2 性質探討 ……………………………………………… 23
4.2.1 抽樣分布與性質 ………………………………… 24
4.2.2 樣本大小對參數估計值的探討 ………………… 28
五、 模擬比較 …………………………………………………… 30
5.1 簡單迴歸模式 ………………………………………… 30
5.2 二變數複迴歸模式 …………………………………… 33
5.3 二階多項式迴歸模式 ………………………………… 37
5.4 具交互作用項之複迴歸模型 ………………………… 40
5.5 非線性迴歸模式 ……………………………………… 44
六、 案例分析—糖尿病醫療費用迴歸模式 …………………… 48
七、 結論與未來工作 …………………………………………… 51

參考文獻 ………………………………………………………… 53
附錄一 …………………………………………………………… 54
附錄二 …………………………………………………………… 56
附錄三 …………………………………………………………… 58
1. Chao, M.T. and Lin, G.D. (1993), The Asymptotic Distributions of the Remedians, Journal of Statistical Planning and Inference, 37, 1-11.
2. Cleveland, W. S. and Sun, D. X. (2000), Internet Traffic Data. Journal of the American Statistical Association, 95, 979-985.
3. Hand, D.J., Blunt, G., Kelly, M. G. and Adams, N. M. (2000), Data Mining for Fun and Profit. Statistical Sciences, 15, 111-131.
4. Hurley, C. and Modarres, R. (1995), Low-Storage Quantile Estimation. Computational Statistics, 10, 311-325.
5. Li, Runze, Lin, Dennis K.J. and Li, Bing. (2001), Statistical Inference on Large Data Set. Department of Statistics, The Pennsylvania State University Technique Report.
6. Neter, J., Kutner, M. H., Nachtsheim, C. J. and Wasserman. W. (1996), Applied Linear Regression Models, 3rd edition, Richard D. Irwin, Burr Ridge, Illinois.
7. Pearl. J. (1981), A Space-Efficient On-Line Method of Computing Quantile Estimates. Journal of Algorithms, 2, 164-177.
8. Robins. H and Monro S. (1951), A Stochastic approximation method. Ann. Math. Statist., 22, 400-427.
9. Rousseeuw, P.J. and Bassett, G.W. (1990), The Remedian: A Robust Averaging Method for Large Datasets, Journal of the American Statistical Association, 85, 97-104.
10. Tierney, L. (1983), A Space-Efficient Recursive Procedure For Estimating A Quantile of An Unknown Distribution. SIAM Journal on Scientific and Statistical Computing, 4(4): 706-711.
連結至畢業學校之論文網頁點我開啟連結
註: 此連結為研究生畢業學校所提供,不一定有電子全文可供下載,若連結有誤,請點選上方之〝勘誤回報〞功能,我們會盡快修正,謝謝!
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊