(3.236.222.124) 您好!臺灣時間:2021/05/19 11:32
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

: 
twitterline
研究生:王秀雯
研究生(外文):Wang, Hsiu-Wen
論文名稱:應用資料挖掘技術於交通事故傷亡嚴重程度之研究
論文名稱(外文):Analysis of Injury Severity of Traffic Accidents Using Data Mining Techniques
指導教授:張立言張立言引用關係
指導教授(外文):Chang, Li-Yen
學位類別:碩士
校院名稱:國立嘉義大學
系所名稱:運輸與物流工程研究所
學門:運輸服務學門
學類:運輸管理學類
論文種類:學術論文
論文出版年:2005
畢業學年度:92
語文別:中文
中文關鍵詞:交通事故事故嚴重性資料挖掘分類和迴歸樹分類樹多元羅吉特
外文關鍵詞:Injury severityData miningCARTLogit model
相關次數:
  • 被引用被引用:44
  • 點閱點閱:799
  • 評分評分:
  • 下載下載:208
  • 收藏至我的研究室書目清單書目收藏:0
問題:交通事故的發生在現今各國社會層面中是項重要的問題,而運輸安全問題一直是世界各國所共同面臨的主要難題之一。依據交通部之資料顯示,台灣地區近年來每年平均約有3,000人左右死於交通事故,因此,如何改善運輸安全以降低交通事故的嚴重性已為當務之急。以往交通事故資料庫是常年累積為龐大的資料庫,多以採用統計方法處理分析,在分析交通事故方面對於事前資料的處理可能會將部份重要資訊去除,其次,進行變數之選擇亦可能造成部份重要資訊被遺漏。資料挖掘是應用在各領域的資訊科技,過去文獻證實在預測或是分析上均為有效之分析工具,但在運輸安全領域則是相對少見。此分析工具在和統計方法相較之下,主要是能處理大量的資料,而且無須太專業的統計背景即可分析等優點。因此,本論文主要研究目的為應用資料挖掘技術於事故嚴重程度之分析,藉以利用資料挖掘技術分析影響事故嚴重程度之主要原因與影響程度,透過與統計模式之分析結果比較,評估資料挖掘在運輸安全應用之可行性,以提供改善肇事防制工作之參考。
方法:本論文研究對象則是主要針對在台北市發生交通事故的受傷者為觀測者進行分析,時間則是從民國90年1月1日至12月31日共十二個月的資料分析。嘗試利用資料挖掘的技術為主與統計分析模式的方法為輔以進行分析,以資料挖掘技術中分類與迴歸樹及多元羅吉特模式分析造成交通事故嚴重程度之因素,最後,比較兩種模式對於影響事故嚴重程度之變數及預測分類正確率。
結果:第一、就整體預測能力以分類樹優於多元羅吉特模式;第二、就影響事故嚴重程度之變數,多元羅吉特與分類樹大致相同。顯示資料挖掘可以適用於運輸安全領域。最後,在分析結果上,本論文針對車輛、駕駛者管理、道路設計等提出策略性建議,可作為政府及相關單位在肇事預防工作之參考。
The logit or ordered probit model has been employed to analyze the injury severity of vehicular accidents for many years. However, these models have the pre-defined underlying relationship between dependent and independent variables. If this assumption is violated, the model could lead to erroneous estimation of injury likelihood. Data mining techniques which do not require any pre-defined underlying relationship between target (dependent) variable and predictors (independent variables) have been widely applied in the fields of business administration and engineering. Among the data mining techniques, the Classification and Regression Tree (CART) has been one of the most commonly employed techniques and shown to be a powerful tool in dealing with prediction and classification problems. This study collected the information of vehicular accidents occurred in Taipei in 2001. A CART model and a logit model were employed to establish the empirical relationship between injury severity of vehicular accidents and driver characteristics, highway geometric variables, environmental factors and accident variables. The findings by CART indicated that vehicle types, driver’s sobriety and accident variables are the key determinants for injury severity of vehicular accidents. By comparing the prediction performance between CART and logit models, this study demonstrated that data mining techniques are alternative methods for analyzing injury severity of vehicular accidents.
中文摘要…………………………………………………………………………... i
英文摘要…………………………………………………………………………... ii
誌謝………………………………………………………………………………... iii
目錄………………………………………………………………………………... iv
圖目錄……………………………………………………………………………... vi
表目錄……………………………………………………………………………... vii
第一章 緒論………………………………………………………………………. 1
1-1研究動機……………………………………………………………………. 1
1-2研究目的……………………………………………………………………. 2
1-3研究範圍與對象……………………………………………………………. 3
1-4研究架構與流程……………………………………………………………. 3
第二章 文獻探討…………………………………………………………………. 5
2-1交通事故嚴重程度…………………………………………………………. 5
2-2資料挖掘應用領域…………………………………………………………. 11
2-3文獻小結……………………………………………………………………. 17
第三章 研究方法…………………………………………………………………. 18
3-1統計模式……………………………………………………………………. 18
3-1-1多元羅吉特模式………………………………………………………. 18
3-1-2檢定多元羅吉特模式之相關統計量…………………………………. 19
3-2資料挖掘……………………………………………………………………. 20
3-2-1資料挖掘概念…………………………………………………………. 20
3-2-2分類和迴歸樹…………………………………………………………. 24
3-3統計模式與資料挖掘之模式比較…………………………………………. 38
第四章 資料收集…………………………………………………………………. 40
4-1資料來源與範圍……………………………………………………………. 40
第五章 分析結果…………………………………………………………………. 41
 5-1樣本資料基本統計分析……………………………………………………. 41
5-2多元羅吉特模式之建立……………………………………………………. 44
5-3分類樹評估結果……………………………………………………………. 53
5-3-1 模式分析結果………………………………………………………… 53
5-3-1-1最適樹模式結果………………………………………………….. 54
5-3-1-2模式分析結果評估……………………………………………….. 56
5-4多元羅吉特模式與分類樹之比較…………………………………………. 65
5-5小結…………………………………………………………………………. 69
第六章 結論與建議………………………………………………………………. 71
6-1結論…………………………………………………………………………. 71
6-2建議…………………………………………………………………………. 72
參考文獻…………………………………………………………………………... 74
附錄一 Gini分類樹………………………………………………………………. I
附錄二 Twoing分類樹…………………………………………………………… II
1. Abdalla, I. M., 2002. Fatality risk assessment and modeling of drivers responsibility for causing traffic accidents in Dubai, Journal of Safety Research, 33(1), 483-496.
2. Al-Ghamde, A. S., 2002. Using logistic regression to estimate the influence of accident factors on accident severity, Accident Analysis and Prevention, 34(6), 729-741.
3. Al-Ghamdi, A. S., 2003. Analysis of traffic accidents at urban intersections in Riyadh, Accident Analysis and Prevention, 35(5), 717-724
4. Assum, T., 1997. Attitudes and road accident risk, Accident Analysis and Prevention, 29(2), 153-159.
5. Bevilacqua, M., Braglia, M., Montanari, R., 2003. The classification and regression tree approach to pump failure rate analysis, Reliability Engineering and System Safety, 79(1), 59-67.
6. Breiman, L., Friedman, J. H., Olshen, R. A., Charles J. Stone, 1984. Classification and Regression Trees, Wadsworth, California.
7. Chang, L.Y., Mannering, F., 1999. Analysis of injury severity and vehicle occupancy in truck- and non-truck-involived accidents, Accident Analysis and Prevention, 31(5), 579-592.
8. Fayyad, U. M., 1996. Data mining and knowledge discovery: Making sense out of data, IEEE Expert, 11(5), 22-23.
9. Fayyad, U. M., Gregory P. S., Smyth, P., Uthurusamy, R., 1996. Advances in knowledge discovery and data mining, Menlo Park, CA: AAAI Press/The MIT Press.
10. Fayyad, U. M., Stolorz, P., 1997. Data mining and KDD: Promise and challenges, Future Generation Computer Systems, 13(2-3), 99-115.
11. Feelders, A., Daniels, H., Holsheimer, M., 2000. Methodological and practical aspects of data mining, Information & Management, 37(5), 271-281.
12. Han, J., Kamber, M., 2001. Data mining: Concepts and Techniques, Morgan Kaufmann Publishers, Simon Fraser University.
13. Karlaftis, M. G., Golias, I., 2002. Effects of road geometry and traffic volumes on rural roadway accident rates, Accident Analysis and Prevention, 34(3), 357-365.
14. Kim, K., Nitz, L., Richardson, J., Li, L., 1995. Personal and behavioral predictors of automobile crash and injury severity, Accident Analysis and Prevention, 27(4), 469-481.
15. Kockelman, K. M., Kweon, Y. J., 2002. Driver injury severity: an application of ordered probit models, Accident Analysis and Prevention, 34(3), 313-321.
16. Kuhnert, P. M., Do, K. A., McClure, R., 2000. Combining non-parametric models with logistic regression: an application to motor vehicle injury data, Computational Statistics & Data Analysis, 34(3), 371-386.
17. Lewis, R. J., An Introduction to Classification and Regression Tree (CART) Analysis. http://www.saem.org/download/lewis1.pdf
18. Lian, J., Lai, X.M., Lin, Z.Q., Yao, F.S., 2002. Application of data mining and process knowledge discovery in sheet metal assembly dimensional variation diagnosis, Journal of Materials Processing, 129(1-3), 315-320.
19. Long, J. S., 1997. Regression models for categorical and limited dependent variables. Sage Publications, Inc.
20. Marshall, R. J., 2001. The use of classification and regression trees in clinical epidemiology, Journal of Clinical Epidemiology, 54(6), 603-609.
21. Michel, Bedard, Gordon, H. G., Michael, J. S., Hirdes, J. P., 2002. The independent contribution of driver, crash, and vehicle characteristics to driver fatalities, Accident Analysis and Prevention, 34(6), 717-727.
22. Milne, R., Drummond, M. and Renoux, P., 1998. Predicting paper making defects on-line using data mining, Knowledge-Based Systems, 11(5-6), 331-338.
23. Mohamed, A. A., 2003. Analysis of driver injury severity levels at multiple locations using ordered probit models, Journal of Safety Research, 34(5), 597-603.
24. Mussone, L., Ferrari, A., Oneta, M., 1999. An analysis of urban collisions using an artificial intelligence model, Accident Analysis and Prevention, 31(6), 705-718.
25. Nerini, D., Durbec, J. P., Manté, C., 2000. Analysis of oxygen rate time series in a strongly polluted lagoon using a regression tree method, Ecological Modeling, 133(1-2), 95-105
26. Neter, J., Kutner, M., Nachtssheim, C. and Wasserman, W., Applied linear regression models 3rd. Richard Irwin Inc, 1999.
27. O’Donnell, C. J., Connor, D.H., 1996. Predicting the severity of motor vehicle accident injuries using models of ordered multiple choice, Accident Analysis and Prevention, 28(6), 739-753.
28. Ouddus, M. A., Noland, R. B., Chin, H. C., 2002. An analysis of motorcyle injury and vehicle damage severity using ordered probit models, Journal of safety research, 33(4), 445-462.
29. Sebzalli, Y.M., Wang, X.Z., 2001. Knowledge discovery from process operational data using PCA and fuzzy clustering, Engineering Applications of Artifical Intelligence, 14(5), 607-616.
30. Shanker, V., Mannering, F., 1996. An exploratory multinomial logit analysis of single-vehicle motorcycle accident severity, Journal of Safety Research, 27(3), 183-194.
31. Simoudis, E., 1996. Reality check for data mining, IEEE Expert, 11(5), 28-30.
32. Sung, H. H., Park, S. C., 1998. Application of data mining tools to hotel data mart on the Interanet for database marketing, Expert systems with Application, 15(1), 1-31.
33. Vorko, A., Jovic, F., 2000. Multiple attribute entropy classification of school-age injuries, Accident Analysis and Prevention, 32(3), 445-454.
34. Washington, S., Karlaftis, M. and Mannering, F., Statistical and econometric methods for transportation data analysis. CRC Press, 2003.
35. Worth, A. P., Dronin, M. T., 2003. The use of discriminant analysis, logistic regression, classification tree analysis in the development of classification models for human health effects, Journal of Molecular Structure, 622(1-2), 97-111.
36. Yau, K. K. W., 2004. Risk factors affecting the severity of single vehicle traffic accidents in Hong Kong, Accident analysis and prevention, 36(3), 333-340.
37. Zajac, S. S., Ivan, J. N., 2003. Factors influencing injury severity of motor vehicle-crossing pedestrian crashes in rural Connecticut, Accident Analysis and Prevention, 35(3), 369-379.
38. Zhang, J., Lindsay, J., Clarke, K., Robbins, G., Mao, Y., 2000. Factors affecting the severity of motor vehicle traffic crashes involving elderly drivers in Ontario, Accident Analysis and Prevention, 32(1), 117-125.
39. 張希鳯, 2001. “資料採掘於精神分裂症之研究”, 樹德科技大學資訊管理系碩士論文
40. 張百棧、蔡介元、謝日章, 2002. “應用資料挖掘於顧客關係管理之研究-以化妝品業為例”, 工業工程期刊, 19(6), 45-59
41. 許哲瑋, 2002. “資料挖掘與統計方法應用於資料庫行銷之實證研究-以美妝保養品為例”, 台北大學企管系碩士論文
42. 曾宏平, 2002. “運用資料挖掘技術發展建設公司企業知識-以售後服務資料庫為例”, 國立高雄第一科技大學營建工程所碩士論文
43. 蔡家昌, 2001. “應用決策樹歸納法探討台灣行動電話市場區隔”, 國立台北大學統計學系碩士論文
44. 蔡政智, 2001. “應用CART決策樹與資料視覺技術於低良率晶圓成因探討”, 元智大學工業工程與管理學系碩士論文
45. 賴信良, 2002. “資料挖掘在教育上的應用-以國小學童「體適能測驗」為例”, 國立台北師範學院數理教育研究所碩士論文
46. 鄭順林及康惠雯,資料採礦中的統計預測與分類方法(一) http://mail.thu.edu.tw/~sljeng/Datamining/predict.htm
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
1. 李國雄,「柯林頓政府與美國東南亞政策」,美歐月刊,第11卷第12期,1996年12月,頁36。
2. 李國雄,「東協安全機制的演變與區域秩序」,問題與研究,第34卷第9期,民國84年9月,頁21-40。
3. 周煦,「美國柯林頓政府的亞太政策」,美歐月刊,第11卷第3期,1996年3月,頁4-22。
4. 李柏泉,「新加坡之外交政策」,問題與研究,第15卷第12期,民國65年9月,頁65-68。
5. 李文志,「海陸爭霸下亞太戰略形勢發展與臺灣的安全戰略」,東吳政治學報,第13期,民國90年,頁129-174。
6. 金家鎮,「從戰略層面看東南亞軍事地理的特徵」,問題與研究,第23卷第9期,民國73年6月,頁80。
7. 徐本欽,「新加坡政治領導層與繼承問題」,問題與研究,第27卷第7期,民國77年4月,頁42-51。
8. 秦宗春,「比較韓國與新加坡科技發展策略」,經濟情勢暨評論季刊,第3卷第3期,民國86年11月,頁119-132。
9. 許懷聰,「新加坡的外交政策」,問題與研究,第23卷第8期,民國73年5月,頁22-34。
10. 陳佩修譯,徐本欽著,「新加坡對東南亞國家協會區域合作的觀點」,東南亞季刊,第1卷第2期,民國85年4月,頁14-22。
11. 陳鴻瑜,「東南亞的區域主義及其面臨之挑戰」,東亞季刊,第23卷第1期,民國80年7月,頁33。
12. 陳鴻瑜,「美國自菲律賓撤軍及其與東南亞之安全關係」,美國月刊,第8卷,第3期,民國82年3月,頁37-38。
13. 陳鴻瑜,「新加坡的外交政策」,問題與研究,第28卷第10期,民國78年7月,頁36-52。
14. 陳鴻瑜,「新加坡的威權主義民主與發展型態」,問題與研究,第30卷第3期,民國80年3月,頁29-40。
15. 陳鴻瑜,「蘇聯對東南亞的外交政策-一個歷史的觀察」,東亞季刊,第15卷第4期,民國73年4月,頁48-49。