(3.227.249.155) 您好!臺灣時間:2021/05/07 05:25
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果

詳目顯示:::

我願授權國圖
: 
twitterline
研究生:劉秩穎
研究生(外文):Chih Ying Liu
論文名稱:應用流程導向資料品質量測方法於資料倉儲過程中之實證研究
論文名稱(外文):An Empirical Study for Implementing a Process-Centric Data Quality Control in Data Warehousing
指導教授:陳仲儼陳仲儼引用關係陳春賢陳春賢引用關係
指導教授(外文):C. Y. CHENC. H. CHEN
學位類別:碩士
校院名稱:長庚大學
系所名稱:資訊管理學研究所
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2008
畢業學年度:96
論文頁數:102
中文關鍵詞:資料品質資料倉儲品質量測流程導向能力成熟度整合模式
外文關鍵詞:Data QualityData WarehousingQuality MeasureProcess-Centric ApproachCMMI
相關次數:
  • 被引用被引用:0
  • 點閱點閱:204
  • 評分評分:系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔系統版面圖檔
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
資料上的錯誤對企業來說,有些具有一定程度上的影響,有些則影響不大,因此資料品質量測不應將所有錯誤資料對企業造成之影響程度皆視為相同。針對此問題,目前已有研究將品質量測方法應用在資料倉儲方面,並在資料演化的過程中加入能反應成本之資料準確度當作品質指標,以達到將重要資料對結果的影響程度放大之效果。
針對上述的研究結果,本研究採實務驗證研究以企業之資料倉儲的實例來進行上述資料品質量測方法的驗證,並探討實作的結果對於該企業的決策會造成何種程度的影響。最後本研究嘗試以CMMI的概念制度化在資料倉儲中資料品質控制的流程,以提供完整的資料倉儲品質管理內容。本論文所擬達成之成果,不僅在實地運用資料品質提昇的方法,更期望可以經由此實證對企業資料庫中資料品質的提昇提供產業一個可茲參考的制度方法。
Some data have more critical impacts, some do not. Therefore data quality (DQ) should not treat all the errors equally. To effectively understand DQ, process plays a critical role since it is another source for DQ. In this regard a DQ measure has been proposed. Such measure realizes DQ by looking at the process of data creation and considering different impacts due to different data fields.
Based on this approach, this study conducts an empirical study regarding the real use of the approach with necessary modification. Several real examples are supplied as well to examine the validity of the approach. Finally, this study implemented CMMI to institutionalize the process of data quality control in data warehousing and provided integrated content of that. Our achievements not only proved that DQ measure can improve a company’s data quality but also provided industry a referable and institutional method.
目錄
長庚大學碩士論文著作授權書 iii
誌 謝 iv
摘 要 v
Abstract vi
目錄 vii
圖目錄 xi
表目錄 xiii
第一章 緒 論 1
1.1研究背景 1
1.2資料品質量測方法之提出 2
1.2.1資料品質改善 2
1.2.2資料倉儲之資料品質控制 3
1.3問題描述與研究動機 4
1.4研究目的與預期效益 5
1.5研究步驟 6
第二章 文獻探討 7
2.1資料品質與量測方法 8
2.1.1資料品質之定義與構面 8
2.1.2簡易資料錯誤率量測方法 10
2.1.3流程導向資料品質量測 11
2.2流程專注的資料品質指標 13
2.3 CMMI之探討與應用 20
2.3.1 CMM與CMMI介紹 20
2.3.2 CMMI 模組 21
2.3.3制度化措施 25
2.3.4 CMMI之應用 27
2.4關鍵績效指標 29
2.4.1關鍵績效指標的介紹 29
2.4.2關鍵績效指標制訂類型 29
第三章 研究方法 32
3.1實證研究程序 32
3.2實證研究架構與方法 36
3.2.1企業專案資訊 37
3.2.2 KPI驗證機制 37
3.2.3基本假設 39
3.2.4流程導向之資料品質量測模型 40
3.2.5驗證 41
3.3實證研究工具 42
3.4制度化流程設計 44
3.4.1資料倉儲之資料品質控制 45
3.4.2資料品質控制之制度化 45
第四章 實證研究 50
4.1實證研究對象設定 50
4.2專案資料蒐集與整理 51
4.2.1專案介紹 51
4.2.2資料設定 54
4.3資料品質值運算 56
4.4 KPI之成果驗證 60
4.4.1運算成果檢視 60
4.4.2專案成果 61
4.4.3 KPI成果驗證 62
第五章 討論 67
5.1品質指標公式的有效性 67
5.1.1變更現有工具 67
5.1.2品質指標有效性 68
5.2企業效益分析 69
5.3資料品質改善制度化成果 71
第六章 結論與未來展望 75
6.1結論 75
6.2未來展望 76
參考文獻 77
附錄一 83
附錄二 87
附錄三 88
附錄四 89

圖目錄
圖1-1:本論文研究步驟圖 6
圖2-1:本研究之環境圖 7
圖2-2:將準確度數量化模型 12
圖2-3:錯誤率在資料倉儲應用之研究 15
圖2-4:在載入流程後之機率密度函數錯誤率分配 16
圖2-5:資料經過確認流程後之機率樹 17
圖2-6:CMMI模式(階層式)的組件 23
圖2-7:CMMI模式(連續式)的組件 24
圖2-8:GQM流程設計 31
圖3-1:企業實證研究之步驟圖 35
圖3-2:本研究實證架構圖 36
圖3-3:外掛程式主畫面 43
圖3-4:資料庫管理工具 44
圖4-1:實證專案在資料倉儲應用之流程 52
圖4-2:運算步驟之一 57
圖4-3:運算步驟之二 57
圖4-4:運算步驟之三 58
圖4-5:運算步驟之四 58
圖4-6:運算步驟之五 59
圖4-7:運算步驟之六 59
圖4-8:在不同資料量中發掘一筆錯誤需花費之時間 62
圖4-9:在固定資料量中發掘一筆錯誤之時間隨正確率變動 63
圖5-1:修改後資料庫管理工具 67

表目錄
表2-1:資料品質量測方法過程中之符號與說明表 13
表2-2:CMMI的階層式與連續式 22
表2-3:CMMI階層式/連續式階層結構 22
表2-4:管理制度化之GG與GP 26
表3-1:以GQM模式發展之資料品質關鍵績效指標 38
表3-2:DQC流程與制度化執行方法 47
表3-3:DWDQC流程的制度化作法 48
表4-1:實證專案所需資料欄位 54
表4-2:實證專案之欄位成本 56
表4-3:實證專案之欄位成本與權重 65
表4-4:資料品質關鍵績效指標成果 66
表5-1:依實證公司現況制定DWDQC流程的制度化作法 73
中文部份:
[1] CMMI產品團隊(2002),「能力成熟度整合模式(CMMISM) 1.2版-階段式表述」用於系統工程、軟體工程、整合的產品與流程發展及委外作業的CMMISM(CMMI-SE/SW/IPPD/SS, V1.2)。
[2] CMMI產品團隊(2002),「能力成熟度整合模式(CMMISM) 1.2版-連續式表述」用於系統工程、軟體工程、整合的產品與流程發展及委外作業的CMMISM(CMMI-SE/SW/IPPD/SS, V1.2)。
[3] 許凱琳,「建構一流程導向量測方法來呈現資料倉儲過程中有關 資料品質影響嚴重程度之研究」,私立長庚大學,碩士論文,民國96年。
[4] 陳仲儼,游佩蓉,「產業電子化能力成熟度模式(EB-CMM)之研究:以藥妝產業為例」,電子商務學報 (已接受),民國96年。
[5] 陳仲儼,「資料品質之研究:建立一個能反映資料錯誤對於決策實際影響程度之品質量測方法」,行政院國家科學委員會專題研究計畫(編號:96-2628-E-008-076-MY2)(未出版) ,民國96年。

英文部分:
[1] Ballou, D. P. and Pazer, H. (1985). Modeling Data and Process Quality in Multi-Input, Multi-Output Information System. Management Science, 31(2), 150-162.
[2] Ballou, D. P. and Tayi, G. K. (1999). Enhancing DQ in DW Environment. Communications of the ACM, 42(1), 73-78.
[3] Basili, V. and Rombach, D. (1988). The TAME project: Towards Improvement-Oriented Software Environments. IEEE Trans. Softw. Eng., 14 (6), 758-773.
[4] Basili, V. and Weiss, D. (1984). A Methodology for Collecting Valid Software Engineering Data. IEEE Trans. Softw. Eng., 10(6), 728-738.
[5] Berenbach, B. (2006). Introduction to Product Line Requirements Engineering. Software Product Line Conference, 2006 10th International, 2003 Proceedings, 215-215.
[6] Bowen, P. L., Fuhrer, D. A., Guess, F. M., (1998). Continuously Improving Data Quality in Persistent Database. Data Quality Journal, 4(1).
[7] Caballero, I. and Piattini, M. (2003). CALDEA: a Data Quality Model Based on Maturity Levels. Quality Software, 2003. Proceedings. Third International Conference on, 380-387.
[8] Chen, C.Y., Kuo, C.Y. and Chen, P. C. (2007). A Preliminary Study of Data Quality Measure with the Emphasis on Error Criticality. Proceedings of the 2007 Industrial Engineering Research Conference (IERC).
[9] Cross, K. and Lynch, R. (1990). Tailoring performance measures to suit your business. Journal of Accounting .
[10] Cushing, B. (1974). A Mathematical Approach to the Analysis and Design of Internal Control Systems. The Accounting Review, January, 24-41.
[11] Doherty, N. F. and Doig, G. (2003). An Analysis of the Anticipated Cultural Impacts of the Implementation of Data Warehouses. IEEE Trans. Eng. Manag., 50(1), 78–88.
[12] English, L. (1999). DW and Business Information Quality. John Wiley &Sons Inc.: New York.
[13] Fenton, N. (1991). Software Metrics: A Rigorous Approach. Chapman and Hall.
[14] Firth, C. P. (1996). Data Quality in Practice: Experience from the Frontline. The 1996 Information Quality Conference, Massachusetts Institute of Technology, October, 25-26.
[15] Fuggetta, A., Lavazza, L., Morasca, S., Cinti, S., Oldano, G. and Orazi, E. (1998). Applying GQM in an Industrial Software Factory. ACM Transactions on Software Engineering and Methodology (TOSEM), 7(4), 411-448.
[16] Hamlen, S. (1980). A Chance-Constrained Mixed Integer Programming Model for Internal Control Design. Account Review, LV(4), (October), 578-593.
[17] Janaina, C. A. and Tereza, G. K.(1999). A GQM-Based Tool to Support the Development of Software Quality Measurement Plans. ACM SIGSOFT Software Engineering Notes, 24(4), 75-80.
[18] Jang, Y., Ishii, A. T. and Wang, R. Y. (1995). A Qualitative Approach to Automatic Data Quality Judgment. Journal of Organizational Computing, 5(2), 101-121.
[19] Jason, J. M. (1988). Data Quality: The Achilles Heel of End-User Computing. Omega Int. J. of Mgmt Sci., 16(5), 491-502.
[20] Johnson, J., Leitch, R. and Neter, J. (1981). Characteristics of Errors in Accounts Receivable and Inventory Audits. The Accounting Review, LV(2), 270-293.
[21] Kaplan, R. S. and Norton, D. P. (1992). The balance scorcard measures that drive performance. Harvard Business Review, 71(9).
[22] Kaplan, R. S. and Norton, D. P. (1992). Using the balance scorcard as a strategy management system. Harvard business Review, 74 (1), 75-85.
[23] Kerzner, H. (2003). Project Management: A Systems Approach to Planning , Scheduling and Controlling. (8th ed.). New Jersey: John Wiley & Sons.
[24] Kim, W, Choi, B.J., Hong, E.K., Kim, S.K. and Lee, D. (2003). A Taxonomy of Dirty Data. Data Mining and Knowledge Discovery, 7(1), 81-99.
[25] Maisel, L. (1992). The Balance Scorecard Approach. Journal of Cost Management, 47-52.
[26] Marshall, S. and Mitchell, G. (2002). ANE-Learning Maturity Model? . ASCILITE 2002 conference.
[27] Martin, V.A., Hatzakis, T., Lycett, M.and Macredie, R. (2004). Building the Business/IT Relationship through Knowledge Management. Information Technology Cases and Applications, 6(2), 27-47.
[28] McRoberts, H. A. and Sloan, B. C. (1998). Financial Management Capability Model. Government Auditing, 25(3), 8-11.
[29] Morey, R. C. (1982). Estimating and Improving the Quality of Information in a MIS. Communications of the ACM, 25(5), 337-342.
[30] Nielsen, P. A. and Ngwenyama, O. (2003). Competing Values in Software Process Improvement: an Assumption Analysis of CMM from an Organizational Culture Perspective. IEEE Trans. Eng. Manag., 50(1), 100-112.
[31] Oman, R. C. and Ayer, T. B. (1988). Improving Data Quality. Journal of Systems Management, 31-35.
[32] Orr, K. (1998). Data Quality and Systems Theory. Communications of the ACM, 41(2), 66-71.
[33] Paradice, D. B. and Fuerst, W. L. (1991). An MIS Data Quality Methodology Based on Optimal Error Detection. Journal of Information Systems, Spring, 50-66.
[34] Pierce, E. (1997). Modeling Database Error Rates. The Data Quality Journal, 3(1), 14-30.
[35] Redman, T. C. (1996). Data Quality for the Information Age. Artech House Inc.:Boston.
[36] Sargent, P. (1992). Data Quality in Material Information Systems. Computer-Aided Design, 24(9), 477-490.
[37] Saaty, T. L. (1980). The analytic hierarchy process. New York: McGraw-Hill.
[38] SEI. (2006). CMMI for Development (CMMI-DEV) Version1.2. CMU/SEI, http://www.sei.cmu.edu/.
[39] Sen, A., Sinha, A. P. and Ramamurthy(2006). Data Warehousing Process Maturity: An Exploratory Study of Factors Influencing User Perceptions. IEEE Transactions on Engineering Management, 53(3), 440-455.
[40] Strong, D. M., Lee, Y. M. and Wang, R. Y. (1997). Data Quality in Context. Communications of the ACM, 40(5), 103-110.
[41] Solingen, R. V. and Berghout, E. (1999). The Goal/Question/Metric Method. McGraw-Hill.
[42] Tayi, G. K. and Ballou, D.P. (1998). Examining Data Quality. Communications of the ACM, 41(2), 54-57.
[43] Vassiliadis, P., Bouzeghoub, M. and Quix, C. (2000). Towards Quality-Oriented Data Warehouse Usage and Evolution. Information Systems, 25(2), 89-115.
[44] Wang, R. Y. and Strong, D. M. (1996). Beyond Accuracy: What Data Quality Means. Journal of Management Information Systems, 12(4), 5-34.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關期刊
 
系統版面圖檔 系統版面圖檔