跳到主要內容

臺灣博碩士論文加值系統

(44.220.247.152) 您好!臺灣時間:2024/09/19 00:28
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:林慶文
研究生(外文):Chen-wen lin
論文名稱:以大眾分類法為基礎之網站內容分類架構—以社群書籤網站為例
論文名稱(外文):A Classification Framework of Website Content Based on Folksonomy in Social Bookmarking
指導教授:皮世明皮世明引用關係
指導教授(外文):Shih-Ming Pi
學位類別:碩士
校院名稱:中原大學
系所名稱:資訊管理研究所
學門:電算機學門
學類:電算機一般學類
論文種類:學術論文
論文出版年:2007
畢業學年度:95
語文別:中文
論文頁數:70
中文關鍵詞:WordNet大眾分類社群書籤分類權重機制Web2.0
外文關鍵詞:FolksonomySocial bookmarkingWeb2.0WordNetClassification Method
相關次數:
  • 被引用被引用:7
  • 點閱點閱:1070
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:6
自動化文件分類技術在知識管理領域應用相當廣泛,傳統上自動化文件分類技術主要以兩大方向進行。第一種方向是以關鍵字為基礎的分類方法,例如早期的TFIDF以及近幾年應用廣泛的支援向量機方法(SVM)等。但是以關鍵字為基礎的分類分法卻擁有關鍵字語意不清問題。第二種方向則是以語意分析為基礎的分類方法,早期是以關鍵字的語意分析為主,而近幾年有專家學者提出以本體論解決語意問題,但本體論在建構上卻有專家知識領域代表性的疑慮,較無客觀的建構方法。因此,大眾分類法(Folksonomy)便是在Web2.0的衝擊與眾多分類問題之情況下衍生的分類概念,以廣大的使用者取代以往專家定義資訊的現象。但大眾分類法仍是以關鍵字為基礎,依舊有語意上的問題。故本研究提出一個大眾分類權重機制,應用於社群書籤網站。期望能解決大眾分類在語意同義字及分類效果不佳的問題。
為了改善大眾分類效果之問題,本研究擬提出一個大眾分類的權重機制應用於社群書籤網站上。首先在使用者訂定個人書籤時,會自動收集個人書籤之標籤關鍵字(Tag)。接著將標籤關鍵字進行斷詞處理,再利用WordNet詞彙庫查詢同義詞之相關詞彙。最後運用TFIDF詞彙計算的概念,計算出同義詞的分類權重值及進行細項的調整後即完成分類的動作,並將分類結果列表供使用者查詢。
研究結果顯示,本研究提出的大眾分類權重機制,有效縮減標籤分類的數量達百分之三十以上,且明顯改善標籤分類之品質及增加使用者的滿意度。表示本研究提出的大眾分類權重機制,可有效的改善大眾分類中語意同義字以及分類效果不佳等問題。
Document classification technique applies extensively in knowledge management and enterprise. Automation document classification has focused on two dimensions. The first domain is keyword-based that is based on TFIDF in the early time, and develop into SVM for the modern way. However, the keyword-based automation document classification has problems of semantic. The second classification is semantic-based that has focused on keyword-based problem-solving. Many researchers propose that ontology-based classification can solve keyword-based semantic problem. But need to concern with how to build ontology and the representation of defining the domain of expert knowledge. Due to these dubious interpretation, Folk Classification (Folksonomy) is produced of Web2.0 conception, and based on keyword-based. This paper proposed a Folk Classification Bookmark System that com combined WordNet and TFIDF classification method. We expect the Folk Classification Bookmark System can solve the semantic and classification problem.
This research proposes the mechanism of Folk Classification Bookmark System that integrates WordNet and TFIDF technologies. Users can define the tag by themselves. After separating the keyword from tags, the system will find the synonym from WordNet. Finally the synonym would use TFIDF to classify and user can query or browse from the “keyword”.
On the research, results of this study show that Folk Classification achieves 30% or higher data reduced rate. The result of the classification promotes the classified data quality and increase user satisfaction. On the conclusion, this study proposes the mechanism of Folk Classification, and shows that Folk Classification is capable to improve of synonym and classified problem.
目 錄
中文摘要 I
英文摘要 II
誌謝辭 III
目錄 IV
表目錄 VI
圖目錄 VII
第一章、緒論 1
第一節、研究背景與動機 1
第二節、研究目的與問題 3
第三節、研究範圍 4
第二章、文獻探討 5
第一節、傳統分類學 5
第二節、WEB2.0 11
第三節、大眾分類法 14
1. 標籤註記(Tagging) 14
2. 大眾分類法(folksonomy) 16
第四節、TFIDF 19
第五節、WORDNET 21
第三章、研究方法 23
第一節、建構概念框架 24
第二節、發展系統架構 26
第三節、分析與設計系統 28
第四節、建置與評估系統 39
第四章、雛形系統實作與評估 40
第一節、雛形系統實作 40
1. 需求分析 40
2. 系統分析與設計 41
3. 系統測試 42
第二節、系統評估 44
1. 系統評估 45
2. 統計分析 50
第五章、結論與建議 54
第一節、研究結論 54
第二節、研究限制 55
第三節、未來研究方向 57
參考文獻 59
個人資料 62


表 目 錄
表2-1、Web1.0與2.0之比較 12
表2-2、Web2.0七項特色 13
表2-3、大眾分類優缺點 18
表2-4、WordNet相關研究 22
表3-1、個人資料檔主要欄位說明 28
表3-2、分類參數檔主要欄位說明 29
表3-3、分類資料檔主要欄位說明 29
表3-4、使用者行為定義 31
表3-5、自訂書籤流程主要資料流 32
表3-6、JWordNet 主要函數表 34
表3-7、讀取使用者書籤資料流 35
表3-8、讀取分類參數資料流 36
表3-9、相關語意查詢參數表 36
表3-10、存取分類結果資料流 38
表4-1、測試資料表 43
表4-2、系統實驗使用者之人口統計資料表 51
表4-3、本研究滿意度調查衡量因素表 51
表4-4、單一樣本統計量 52
表4-5、單一樣本檢定 53


圖 目 錄
圖2-1、KNN分類示意圖 6
圖2-2、基因演算法流程圖 7
圖2-3、類神經網路架構圖 8
圖2-4、支援向量機分類示意圖 9
圖2-5、Web2.0概念圖 11
圖2-6、flickr應用標籤分類結果畫面 15
圖2-7、Gmail信箱應用標籤分類畫面 16
圖2-8、「del.icio.us」書籤工具分類結果畫面 17
圖3-1、系統開發研究程序 23
圖3-2、系統概念框架圖 25
圖3-3、系統架構圖 26
圖3-4、WordNet詞彙庫概念圖 30
圖3-5、使用者瀏覽書籤流程 31
圖3-6、使用者自訂書籤流程 32
圖3-7、WordNet語意分析流程 33
圖3-8、大眾分類流程 35
圖3-9、分類權重機制細部流程 37
圖4-1、實作流程圖 40
圖4-2、開發環境與系統平台架構圖 41
圖4-3、雛形法系統開發流程圖 42
圖4-4、系統評估流程 44
圖4-5、使用者註冊畫面 46
圖4-6、修改書籤畫面 46
圖4-7、使用者標籤分類畫面 47
圖4-8、分類結果比較畫面 48
圖4-9、使用者閱讀書籤畫面 49
圖4-10、滿意度調查畫面 50
參考文獻
1.Fichter, D., “Intranet Applications for Tagging and Folksonomies,” Intranet Librarian, 2006, pp. 43.
2.Gao, J., Zhang, J. and Zhou, M., “On the Use of Words and N-grams for Chinese Information Retrieval,” Proceedings of The 5th International Workshop on Information Retrieval with Asian Languages, 2000, pp. 141-148.
3.Golder, S., and Huberman, B. A., “Usage patterns of collaborative tagging systems,” Journal of Information Science,” 32(2), 2006, pp. 198-208
4.Gordon-Murnane, L., “Social Bookmarking, Folksonomies, and Web 2.0 Tools,” Searcher, 14(6), 2006, pp. 26.
5.Gregg, D.G. and Walczak, S., “Auction advisor: An agent-based online-auction decision support system,” Decision Support System, 41(2), 2006, pp. 449-471.
6.Guy, M., and Tonkin, E., Folksonomies:tidying UP Tags? D-Lib Magazine, Vol.12, No.1, 2006. <http://www.dlib.org/dlib/january06/guy/01guy.html>(Accessed January 8, 2007)
7.Kobayashi, M., and Takeda, K., “Information Retrieval on the Web,” ACM Computing Surveys, 32(2), 2000.
8.Larkey, L.S. and Croft, W.B., “Combining classifiers in text categorization,” Proceedings of the 19th ACM International Conference on Research and Development in Information Retrieval (SIGIR-96), 1996, pp. 89-297.
9.De Luca, E. W. and Nürnberger, A., “Improving Ontology-Based Sense Folder Classification of Document Collections with Clustering Methods,” Proceedings of the 2nd International Workshop on Adaptive Multimedia Retrieval (AMR 2004), 2004, pp. 72-86.
10.Mathes, A., “Folksonomies – Cooperative Classification and Communication Through Shared Metadata,” Computer Mediated Communication, LIS590CMC (Doctoral Seminar), Graduate School of Library and Information Science, University of Illinois Urbana-Champaign, 2004. <http://www.adammathes.com/academic/computer-mediated-communication/folksonomies.html> (Accessed January 8, 2007)
11.Miller, G. A., “WordNet: A Lexical Database for English,” Communication of the ACM, 38(11), 2005.
12.Miller, G., A., Leacock, C., Tengi, R., and Bunker, R., T. “A Semantic Concordance,” Human Language Technology Conference, 1993, pp. 303-308.
13.Nunamaker J F, JR., Chen M. and Purdin T.D.M., “Systems Development in information Systems Research,” Journal of Management Information Systems, 1991, pp. 89-106.
14.Ohmukai, I., Hamasaki, M., and Takeda, H., “A Proposal of Community-based Folksonomy with RDF Metadata”, Proceedings of the 4th International Semantic Web Conference (ISWC2005), 2005.
15.O'Reilly, T., What is Web 2.0: Design Patterns and Business Models for the Next Generation of Software, O'Reilly Network, 2005. <http://www.oreillynet.com/lpt/a/6228>(Accessed January 8, 2007)
16.Prabowo, R., and Thelwal, M. , “A comparison of feature selection methods for an evolving RSS feed corpus,” Information Processing and Management, 2006, pp. 1491-1512.
17.Salton, G. and McGill, M., Introduction to Modern Information Retrieval, McGraw-Hill, 1983.
18.Skiba, D. J., “WEB 2.0: Next Great Thing or Just Marketing Hype?” Nursing Education Perspectives, 2006.
19.Song, M., H., Lim, S., Y., Kang, D., J., and Lee, S., J., “Automatic Classification of Web Pages Based on the Concept of Domain Ontology,” Proceedings of the 3rd International Conference on Web Information Systems Engineering (WISE 2002), 2002, pp.182-191.
20.Vapnik, V., Statistical Learning Theory, Springer, N.Y, 1998.
21.Voorhees, E. M., “Query expansion using lexical-semantic relations,” Proceedings of 17th Inter-national Conference on Research and Development in Information Retrieval (SIGIR'94) Dublin, 1994, pp. 61-69.
22.Educause, “7 things you should know about...Social Bookmarking.” Educause Learning Initiative, 2005. <http://www.educause.edu/ir/library/pdf/ELI7001.pdf>(Accessed January 8, 2007)
23.江靜宜,「結合本體論及向量模式於文件分類之研究」,南台科技大學資訊管理研究所未出版碩士論文,2005。
24.許正欣,「語意網上自動化建構本體論之研究」,輔仁大學資訊管理研究所未出版碩士論文,2004。
25.陳品均,「Web 2.0 應用服務策略行動之研究-以Yahoo!、Google、MSN 為例」,國立臺灣大學商學研究所未出版碩士論文,2006。
26.游子賢,「通俗分類標記之自動組織」,國立台灣大學資訊管理學系研究所未出版碩士論文,2006。
27.曾憲雄、蔡秀滿、蘇東興、曾秋蓉、王慶堯,資料探勘Data Mining,旗標出版社,2005。
28.林建宏,「從HEMiDEMi開發經驗談Web2.0」,<http://www.hemidemi.com/blog/doc/HEMiDEMi_web20.pdf>,2006。(Accessed January 8, 2007)
29.維基百科,「社會性書籤」,<http://zh.wikipedia.org/w/index.php?title=%E7%A4%BE%E4%BC%9A%E6%80%A7%E4%B9%A6%E7%AD%BE >。(Accessed January 8, 2007)
30.HEMiDEMi,「什麼是HEMiDEMi共享書籤?」,<http://www.hemidemi.com.tw/>,2006。(Accessed January 8, 2007)
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
1. 余德慧(1998)。生活受苦經驗的心理病理:本土文化的探索。本土心理學研究,10,69-115。
2. 余德慧(1996)。文化心理學的詮釋之道。本土心理學研究,6,146-202。
3. 呂玉瑕(1995)。社會學與性別研究。近代中國婦女史研究,3,177-191。
4. 汪文聖(1997)。「描述」與「解釋」- -胡塞爾現象學作為科學哲學之一探討。哲學雜誌,20,64-89。
5. 李美枝、鍾秋玉(1996)。性別與性別角色析論。本土心理學研究,6,260-299。
6. 李燕蕙(2006)。「人」在心理學與哲學之間。應用心理研究,32,4-6。
7. 林鶴玲、李香潔(1999)。台灣、閩、客、外省族群家庭中之性別資源配置。人文及社會科學集刊,11(4),475-528。
8. 畢恆達(1995)。生活經驗研究的反省:詮釋學觀點。本土心理學研究,4,224-259。
9. 畢恆達(2003)。男性性別意識之形成。應用心理研究,17,51-84。
10. 張慶熊(1997)。生活世界是人類主體間交流的基礎。哲學雜誌,20,116-135。
11. 趙曉娟、黃宗堅(2003)。一個性別認同者的欲走還留--談Bowen代間傳遞歷程的糾纏與困境。諮商與輔導,207,27-31。
12. 蔡錚雲(2006)。現象學心理學的理論與應用:實徵與詮釋兩種應用模式系譜上的對照。應用心理研究,29,53-69。
13. 劉惠琴(2000)。母女關係的社會建構。應用心理研究,6,97-130。
14. 謝小芩(1998)。性別與教育期望。婦女與兩性學刊,9,205-231。