跳到主要內容

臺灣博碩士論文加值系統

(44.192.115.114) 您好!臺灣時間:2023/09/27 02:02
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:莊澤生
研究生(外文):Tse-sheng Chuang
論文名稱:利用資料探勘技術發掘議題網絡
論文名稱(外文):Discovering Issue Networks Using Data Mining Techniques
指導教授:林福仁林福仁引用關係
指導教授(外文):Lin Fu-ren
學位類別:碩士
校院名稱:國立中山大學
系所名稱:資訊管理學系研究所
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2002
畢業學年度:90
語文別:中文
論文頁數:94
中文關鍵詞:議題網絡資訊擷取資料探勘鏈結分析群集分析
外文關鍵詞:link analysisdata mininginformation retrievalclustering analysisissue networks
相關次數:
  • 被引用被引用:17
  • 點閱點閱:439
  • 評分評分:
  • 下載下載:82
  • 收藏至我的研究室書目清單書目收藏:7
近年來資料探勘技術在購物行為分析、客戶關係管理、犯罪調查等方面的應用頗為盛行;然而在與我們日常相關的政治、社會領域的運用,仍然侷限於取樣資料的分析,用以彌補統計工具的不足而已。在本研究中,我們針對政治或公共政策議題,採用議題網絡為描述架構,資料探勘為核心技術;藉由雛型系統的執行,配合個案資料的擷取,發展出以議題為中心的資訊建構和知識發掘方法。
我們的研究重點包含議題網絡資訊建構、參與者群集發掘及網絡關鍵元件發掘三大部分。議題網絡的資訊建構,先以資訊擷取技術將個案議題有關的電子報報導,轉換為結構化的網絡元件;再以圖形和表格方式,由不同角度呈現網絡資訊。在參與者群集發掘部分,我們採用以議題為關聯基礎的參與者群集分析方法。這和傳統依據參與者的行政隸屬或黨派背景,所作的群集判斷有所不同。能夠更就事論事的提供觀察者,有關參與者群集關係和群集變化的資訊。第三個部分是以鏈結分析,依據網絡參與者和子議題間的交互關係及重要性,來判斷參與者和子議題的關鍵程度。
最後我們以專家評估的方式,藉由熟悉個案議題的議員、記者和議會員工,對上述第一個部分進行概念回憶度和概念精確度的效能評估,對第二、第三部分進行確實性、有用性和創新度的效能評估,並與各組評估者的相似度作了比較分析。
By means of data mining techniques development these days, the knowledge discovered by virtue of data mining has ranging from business application to fraud detection. However, too often, we see only the profit-making justification for investing in data mining while losing sight of the fact that they can help resolve issues of global or national importance. In this research, we propose the architecture for issue oriented information construction and knowledge discovery that related to political or public policy issues. In this architecture, we adopt issue networks as the description model and data mining as the core technique. This study is also performed and verified with prototype system constructing and case data analyzing.
There are three main topics in our research. The issue networks information construction starts with text files information retrieving of specified issue from news reports. Keywords retrieved from news reports are converted into structuralized network nodes and presented in the form of issue networks. The second topic is the clustering of network actors. We adopt an issue-association clustering method to provide views of clustering of issue participators based on relations of issues. In third topic, we use specified link analysis method to compute the importance of actors and sub-issues.
Our study concludes with performance evaluation via domain experts. We conduct recall, precision evaluation for first topic above and certainty, novelty, utility evaluation for others.
內容目錄
第一章 緒論1
1.1研究背景與動機1
1.2研究目的2
1.3研究流程3
1.4論文架構4
第二章 文獻探討5
2.1公共政策的政治影響模式5
2.1.1團體理論5
2.1.2鐵三角模式6
2.1.3議題網絡7
2.2資料探勘8
2.3關鍵字擷取9
2.4關聯分析11
2.5群集分析12
2.6鏈結分析13
第三章 研究方法與研究架構15
3.1 研究方法15
3.2 研究單元與研究範圍15
3.2.1 研究單元與關鍵屬性15
3.2.2 研究範圍17
3.3 研究架構17
第四章 議題網絡資訊建構與展現19
4.1個案選擇與網絡元件定義19
4.2議題網絡資訊建構19
4.2.1 議題網絡資訊建構流程19
4.2.2 語意建構22
4.3議題網絡資訊展現24
第五章 參與者群集發掘27
5.1資料探勘技術選擇27
5.1.1 資料特性27
5.1.2 資料探勘技術選擇28
5.2以子議題關聯為基礎的參與者群集分析29
5.2.1 子議題關聯分析29
5.2.1.1 資料項選擇29
5.2.1.2 參數選擇30
5.2.1.3 結果初估30
5.2.2 參與者群集分析31
第六章 網絡關鍵元件發掘36
6.1 資料探勘技術選擇36
6.1.1 問題分析36
6.1.2 資料探勘技術選擇37
6.2 關鍵參與者及關鍵子議題發掘40
6.2.1演算法比較41
6.2.2關鍵參與者擷取42
6.3關鍵子議題發掘與網絡的演進分析43
第七章 議題網絡資訊效能評估45
7.1評估方法設計45
7.1.1評估依據45
7.1.2網絡建構效能的評估項目與方法46
7.1.3網絡發掘效能的評估項目與方法48
7.2網絡建構評估結果與分析50
7.3參與者群集發掘評估結果與分析52
7.4關鍵元件發掘評估結果與分析54
7.4.1關鍵參與者選取評估與分析54
7.4.2關鍵子議題選取評估與分析56
第八章 結論與建議59
8.1研究結果討論59
8.2研究貢獻60
8.3未來研究方向61
參考文獻63
中文部分63
英文部分63
附錄A、議題網絡資料探勘系統介面舉例67
附錄B、評估者代號及背景72
附錄C、效能評估表73
圖目錄
圖1.1 本研究流程4
圖3.1 研究架構18
圖4.1議題網絡資訊建構流程21
圖4.2關鍵字資料庫22
圖4.3語意元件資料庫22
圖4.4樣板式網絡元件選取平台23
圖4.5議題網絡展現表-以子議題為觀察角度25
圖4.6議題網絡展現表-以參與者為觀察角度26
圖5.1以關聯規則為基礎的群集分析流程28
圖5.2以子議題及態度所組合的資料項29
圖5.3 第一階段,分割數為六時系統的產出範例30
圖5.4參與者對各分割的匹配分數(第一階段,六分割)31
圖5.5 參與者對子議題及態度的組合查詢32
圖5.6 吳敦義所涉及的子議題及態度33
圖5.7各階段參與者分群結果及三個重要參與者的群集變化34
圖6.1參與者被報導總次數排名38
圖6.2 hubs值與執行次數比較39
圖6.3參與者hub值排名40
圖7.1議題事實、報導、和系統輸出之關係圖46
圖7.2效能評估時的資訊路徑46
圖7.3網絡發掘能力的效能評估項目49
表目錄
表4.1網絡元件及屬性定義表20
表6.1 不同加權演算法的相似度比較42
表6.2港市合一議題各階段關鍵參與者彙整表42
表6.3港市合一議題各階段關鍵子議題彙整表43
表6.4港市合一議題演進輪廓44
表7.1 網絡建構評估結果51
表7.2 議會員工間概念擷取項目相似度(﹪)52
表7.3 群集發掘評估結果53
表7.4 議會員工間群集分析相似度(﹪)53
表7.5 關鍵參與者選取評估結果54
表7.6 議會員工間關鍵參與者選取相似度(﹪)55
表7.7記者間關鍵參與者選取相似度(﹪)55
表7.8議員間關鍵參與者選取相似度(﹪)56
表7.9關鍵子議題發掘評估結果56
表7.10議員間關鍵子議題選取相似度(﹪)57
表7.11記者間關鍵子議題選取相似度(﹪)57
表7.12 議會員工間關鍵子議題選取相似度(﹪)58
參考文獻中文部分王鐵生譯,Wilson, G. K. 著, 1998,利益團體,五南圖書出版公司。李麟添,1980,立法角色之研究-桃園縣議會第八屆縣議員角色傾向之分析,臺灣商務印書館。倪達仁譯,Austin, R. 著,1995政治學 雙葉出版社。姚祥瑞,2000,台灣地區水庫興建政策與環保團體互動之研究-以美濃水庫為個案分析,文化大學政治學研究所博士論文。黃榮護,1991,公共管理,商鼎文化出版社。陳俊彰,2001,從網頁中發掘教師知識分佈圖,中山大學資訊管理研究所碩士論文。張勳騰,1999,資料探採在通信資料庫上目標行銷的應用,中山大學資訊管理研究所碩士論文。薛智名,2001,虛擬實踐社群之知識圖發掘,中山大學資訊管理研究所碩士論文。劉昶演,1997,民意代表的角色傾向-以第三屆立法委員為例,中山大學政治學研究所碩士論文。魏鏞,朱志宏,詹中原,黃德福,1992,公共政策,國立空中大學印行。英文部分Abramowicz, W., and Zurada, J. “Knowledge Discovery for Business Information System,” Kluwer Academic Publishers, 2001Adriaans, P., and Zantinge, D. “DATA MINING,” ADDISON-WESLEY, 1999.Bently, A.F. “The Process of Government,” Chicago: University of Chicago Press, 1908Berkowitz, S.D.“An interoduction to structural analysis: The network approach to social research,” Toronto: Butterworth, 1982Berry, M.J.A., and Linoff, L. “Data Mining Techniques: For Marketing, Sales, and Customer Support,” John Wiley & Sons, Inc, 1997Bhandari, I. “Can Data Mining Help in Resolving Political Issue,” The On-Line Executive Journal for Data-Intensive Decision Support, September 1, 1998: Vol. 2, No. 351998Bots, P.W.G., VanTwist, M.J.W., and VanDuin, R. “Designing a Power Tool for Policy Analysts: Dynamic Actor Network Analysis,” Proceedings of the 32nd Hawaii International Conference on System Sciences ,1999Chen, H. and Lynch, K.J. “Automatic Construction of Networks of Concepts Characterizing Document Databases,” IEEE TRANSACTIONS ON SYSTEM, MAN, AND CYBERNETICS, VOL. 22, NO. 5, SEP/OCT 1992Chien, L.F. “PAT-Tree-Based Keyword Extraction for Chinese Information Retrieval,” Proceedings of the 1997 ACM SIGIR, Philadelphia, PA, USA, pp.50-58.Choe, C.S. “Public Policy Making and Interest Groups Politics in the U.S: An Analysis of IRCA,” International Area Review, 2001, Vol. 4(1)Eick, S.G. “Visual Discovery and Analysis,” IEEE TRANSACTIONS ON VISUALIZATION AND COMPUTER GRAPHICS, VOL. 6, NO. 1, JANUARY-MARCH 2000.Frawley, W., Piatetsky, S. G.., and Matheus, C. “Knowledge Discovery in Databases: An Overview,” AI Magazine, Fall 1992, pp 213-228.Han, E.H., Karypis, G., Kumar, V. and Mobasher, B. “Clustering Based On Association Rule Hypergraphs,” In Proc. of Workshop on Research Issues on Data Mining and Knowledge Discovery, 1997.Han, J. and Kamber, M. “Data Mining : Concepts and Techniques,” Morgan Kaufmann Publishers, 2001Heaney, M. T. “Issue Networks, Information, and Interest-Group Alliances,” University of Chicago, April 30,2001Heclo, H. “Issue Networks and the Executive Establishment,” American Enterprise Institute, 1978Henzinger, M.R. “Hyperlink Analysis for the Web,” IEEE INTERNET COMPUTING , 1089-7801, 2001 Heywood, A. “Politics,” Palgrave, Formerly Macmillan Press, 1997Horowitz, E., Sahni, S. and Anderson, F.S.,“Fundamentals of Data Structures in C,” New York, 1993Kleinberg, J.M. “Authoritative Sources in a Hyperlinked Environment,” ACM, Vol. 46, No. 5, September 1999, pp. 604 –632 , 1999Lempel, R. and Soffer, A. “PicASHOW: Pictorial Authority Search by Hyperlinks on the Web,” ACM 1-58113-348-0/01/0005 , 2001Mills, C.W. “The Power Elite,” Oxford University Press,Inc., 1956Salisbury, R.H., Heinz, J. P., Nelson, R. L. and Lauman, E. O. “Triangles, Networks, and Hollow Cores: The Complex Geometry of Washington Interest Representation,” In M. P. Petracca(Ed., 1992.Salton, G. and Buckley, C., “Term-Weighting Approaches in Automatic Text Retrieval,” Information Processing & Management. 24, No. 5, 1998.Simoudis, E. “Reality Check for Data Mining,” IEEE EXPER Vol.11.No.5, OCTOBER 1996, pp26-33Smith, H. “The Power Game: How Washington Works,” Ballantine Books. 1988Witten, I.H. and Frank, E. “Data Mining – Practical Machine Learning Tools and Techniques with JAVA Implementations,” Morgan Kaufmann Publishers, 2000Wllsworth, J.W. and Stahnke, A. A. “Politics and Political Systems,” McGraw-Hill, 1976
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top