跳到主要內容

臺灣博碩士論文加值系統

(18.97.9.171) 您好!臺灣時間:2025/01/17 09:40
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:張淑雅
研究生(外文):Shu-Ya Chang
論文名稱:資料探勘前資料品質分析之研究-以審計機關審核 政府機關送審資訊檔案為例
論文名稱(外文):A Research on Data Quality Analysis before Data Mining-The Audit on Informative Archives Which Were Sent by Government Institutions
指導教授:吳偉賢
指導教授(外文):Wei-Hsien Wu
口試委員:薛友仁洪茂盛
口試日期:2016-06-30
學位類別:碩士
校院名稱:國立臺北教育大學
系所名稱:資訊科學系碩士班
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2016
畢業學年度:104
語文別:中文
論文頁數:68
中文關鍵詞:資料品質分析規則庫資料探勘查核控制點審計
外文關鍵詞:Data Quality AnalysisRule BaseData MiningCheck PointAudit
相關次數:
  • 被引用被引用:1
  • 點閱點閱:317
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
本研究運用審計人員提出之專業領域知識(Domain Knowledge),透過程式將其領域知識轉成審計知識規則庫,形成多項查核控制點,以輔助審計人員於巨量資料(Big Data)中找出較高風險之資訊(Information)。使用規則映射集合方法,將審計知識規則庫映射成資料品質分析所需集合(Set),運用集合屬性分析各機關傳送資訊檔案之資料品質,考量審計業務實際需求及執行效能,僅記錄異常資料,以減少儲存空間並提升執行效能。
本研究方法於審計人員審核分析各機關傳送資訊檔案前,及時分析資訊檔案內容,結果顯示機關送審資訊檔案異常或可能影響之查核控制點,提供審計人員預先瞭解送審資訊檔案之資料品質,避免審核異常資料,並減少審計人員因資料品質不佳誤判審核分析結果。另因應各機關傳送之資料量與日俱增,本研究依實務提出資料庫規劃設計,以提升資料庫系統執行效能。
本研究實做結果經測試後,整合於審計機關審核分析系統,實際應用於審計人員查核資訊檔案相關作業,證明本研究方法之有效性及可用性。

This research uses professional domain knowledge proposed by auditors to transform domain knowledge into a rule base of audit knowledge through programs, forming many control points to assist auditors to find high-risk information in Big Data. With collection mapping methods, the rule base of audit knowledge is mapped into sets needed for data quality analysis, and collective attributive analysis is utilized to analyze the data quality of informative archives which were sent by Government Institutions. Considering the actual need and execution effectiveness of audit affairs, this data quality analysis only records abnormal data to reduce storage space and promotes implementation effectiveness.
The research method can analyze informative archives on time before institutions send them. The results indicate that the abnormal informative archives and influential control points can allow auditors to realize the data quality of informative archives in order to avoid auditing abnormal data and to reduce misinterpreting analyzed results. In response to the increasing data which were send by institutions, this research proposed a plan and design of database to promote the implementation effectiveness of the database system.
This research is integrated in the audit analysis system after being tested and is applied to audit works in auditing informative archives, which proved the effectiveness and availability of this research method.

第一章 緒論 1
1.1研究背景與動機 1
1.2研究目的 2
1.3研究範圍及限制 6
1.4論文架構 6
第二章 文獻探討 8
2.1我國中央及地方政府普通公務機關傳送資訊檔案執行概況 8
2.1.1審計機關查核政府預算會計資訊應用平臺說明 10
2.1.2中央及地方政府普通公務審核作業執行概況 14
2.2審計機關審核會計報告電腦化前後之比較 16
2.3政府資料開放平臺 17
2.4資料探勘 18
2.4.1資料前處理 19
2.4.2資料探勘技術與模型 21
2.4.3探勘後處理 24
2.5資料庫系統效能調校 27
第三章 研究方法 29
3.1研究架構 29
3.2研究動機、目的 30
3.3資料特徵 31
3.4準備資料 31
3.5設計模型 32
3.6評估 40
3.7建置布署 41
第四章 結果 42
4.1實驗環境 42
4.2實驗結果 42
4.3整合審核分析系統 46
第五章 結論與建議 48
5.1結論 48
5.2建議 48
參考文獻 50
附錄 52
1.中央政府普通公務機關資料檔案格式 52
2.地方政府普通公務機關資料檔案格式 58
3.資料庫查詢語法範例 63


審計部(2016)。審計機關審核會計月報及相關資訊檔案作業指引。
審計部(2016)。審計機關審核處理原始憑證或有關資料作業指引。
審計部(2016)。審計機關審核會計月報及相關資訊檔案風險評估表。
審計部(2016)。審計機關審核處理各機關或各種基金歲計會計資訊檔案注意事項。
審計部。審計部配合審計法部分條文修正相關規制與審核作業研修及推動小組審核作業推動分組歷次會議紀錄。
審計部。審計部GBA系統審計應用研究專案小組歷次會議紀錄。
審計部。審計部CBA系統審計應用研究專案小組歷次會議紀錄。
審計部(無日期)。審計制度簡介。2016年4月28日取自http://www.audit.gov.tw/files/11-1000-139-1.php。
國家發展委員會(無日期)。政府資料開放平臺。2016年4月28日取自http://data.gov.tw/。
施雅月、賴錦慧(譯)(2008)。資料探勘(原作者:Pang-Ning Tan,Michael Steinbach,Vipin Kumar)。台北市:台灣培生教育出版股份有限公司。(原註出版年:2005)
曾憲雄、蔡秀滿、蘇東興、曾秋蓉、王慶堯(2006)。資料探勘(初版)。台北市:旗標出版股份有限公司。
張云濤、龔玲(2007)。資料探勘原理與技術(初版)。台北市:五南圖書出版股份有限公司。
Claude E. Shannon, Warren Weaver.(1949) The Mathematical Theory of Communication. Univ of Illinois Press.
Von Neumann J., A.W. Burks.(1966), Theory of self-reproducing automata. University of Illinois Press.
Holland J.H.(1975), Adaption in natural and artificial systems, The University Michigan Press, Ann Arbor.
Quinlan J.R. (1979), Discovering rules by induction from large collections of examples. In D. Michie (Ed.), Expert systems in the micro electronic age. Edinburgh University Press.
Breiman, Leo, Jerome Friedman, R.Olshen,C.Stone(1984),Classification and Regression Tree.Belmont, California:Wadsworth.
Quinlan J. R.(1993), C4.5: Programs for Machine Learning. San Mateo: Morgan Kaufmann.
Microsoft, Designing and Implementing OLAP Solutions with Microsoft SQL Server 2000。
Microsoft, Microsoft SQL Server 2000 High Availability 3-Day Skills Course。
T.C. Redman(2001). Data Quality:The Field Guid. Digital Press.
Richard J. Roiger, Geatz, Michael W.(2003), Data Mining(A TUTORIAL-BASED PRIMER), United States:Pearson Education,Inc.
Golfarelli, Matteo, Rizzi, Stefano(2009), Data warehouse design:Modern principles and Methodologies. McGraw-Hill, New York.

QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top