研究生(外文):Shih Wei Huang
論文名稱(外文):Applying Network Analysis to Explore Usage Patterns of Social Bookmarking
指導教授(外文):N. P. Lu
外文關鍵詞:social bookmarkingpower-lawnetwork analysis
社會性書籤網站應用Web 2.0群體智慧的特徵,讓使用者利用標籤的標記功能收藏自己有興趣的網路資源作為書籤。目前國外已有相當多的社會性書籤網站相關研究發表,然而關於國內社會性書籤網站的研究分析仍然有限,因此本研究以台灣的funP推推王書籤網站為研究對象,嘗試探索台灣社會性書籤的使用樣式。首先,我們蒐集2010年7月27日至2010年8月27日為期一個月的書籤資料為研究樣本,進行書籤分類統計、標籤標記個數統計、使用者使用時序分析,初步了解funP推推王的使用概況。然後,再從一個月的書籤資料擷取7月27日至8月2日為期一週的書籤資料,進行細部的使用者、網路資源、標籤三方關係分析。分析結果發現:funP推推王書籤網站的三方關係皆具有冪次定律。因此,我們再檢視主要標籤與網路資源發現:Top 20 標籤與Top 20 網路資源與部落格均有密切關聯。接著,我們調整共享比率門檻值繪製出三方關係拓樸圖,並進行拓樸參數分析與k-核心分析。分析結果發現:在三方關係拓樸的最大k-核心群集中,網路資源也以部落格為主,再次證實標籤與部落格具有極密切的關係。除此之外,內建標籤雖然會造成拓樸群聚度的提昇,卻不影響標籤拓樸中最大k-核心群集的組成結構。
Applying the characteristics of Web 2.0 collective intelligence, social bookmarking sites allow users to bookmark their own network resources of interest by tagging. Although a lot of research about social bookmarking sites has been published, the research on Taiwan social bookmarking sites is still insufficient. Therefore, in this research we tried to reveal the usage patterns of social bookmarking in Taiwan by investigating the Taiwan social bookmarking site: funP. We collected the bookmarks data of funP from July 27, 2010 to August 27, 2010 as the research sample. To overview the application status in funP, we first performed the categorization of bookmarks, counted the usage frequency of tags, and analyzed the usage timing of users. Then, we took the one-week data, from July 27, 2010 to August 2, 2010, to perform a detailed analysis between users, URLs, and tags. We found that the tripartite relationships follow power law. In order to inspect the dominating tags and URLs, we sifted out the Top 20 tags and Top 20 URLs, and found that the tag “blog” has the highest usage frequency and most of the URLs direct to blog sites. Furthermore, we drew the tripartite topology graphs based on sharing ratio thresholds, and performed topology and k-core analyses. We found that the largest k-core groups of URL topologies are also closely relevant to blogs. In additon, the clustering coefficients of tag topologies was increased by system default tags, but the largest k-core groups of the tag topologies were not affected.

國家圖書館授權書 iii
長庚大學碩士論文紙本論文著作授權書 iv
誌謝 v
中文摘要 vi
Abstract vii
第一章 緒論 1
1.1 研究背景 1
1.2 研究動機 2
1.3 研究目的 3
1.4 論文架構 4
第二章 文獻探討 6
2.1 社會性書籤網站 – Web 2.0的應用 6
2.1.1 社會性書籤網站發展 7
2.1.2 社會性書籤網站特徵 8
2.1.3 國內外社會性書籤網站 9
2.1.4 標籤 10
2.1.5 群眾分類法 13
2.1.6 社會性書籤相關研究 16
2.2 RSS相關技術 18
2.2.1 RSS定義與演進 18
2.2.2 RSS格式 20
2.2.3 RSS架構 21
2.3 網絡分析 22
2.3.1 圖形理論 22
2.3.2 方向性與連通成份 23
2.3.3 分支度 23
2.3.4 路徑長度 24
2.3.5 群聚度 25
2.4 k-核心分析 26
2.5 社群網絡相關現象與法則 27
2.5.1 冪次定律與齊夫定律 27
2.5.2 小世界網路 30
2.6 小結 31
第三章 研究方法 32
3.1 研究對象 34
3.2 資料收集方法 36
3.3 資料庫設計 38
3.4 樣本挑選方法 40
3.5 分析項目 41
3.6 小結 42
第四章 社會性書籤統計分析 43
4.1 三方關係集合定義 43
4.2 書籤分類統計 44
4.3 標籤標記個數統計 45
4.4 使用者時序統計 46
4.5 三方關係分析 48
4.6 標籤與網路資源的關聯分析 50
4.7 小結 55
第五章 社會性書籤網絡分析 56
5.1 三方關係拓樸定義 56
5.2 三大元素使用頻率排名分析 59
5.3 使用者拓樸 62
5.4 網路資源拓樸 67
5.5 使用者拓樸與網路資源拓樸參數分析 71
5.6 標籤拓樸 75
5.6.1 Top 20 標籤拓樸 78
5.6.2 Top 20 使用者之標籤使用拓樸 80
5.6.3 Top 20網路資源之標籤使用拓樸 83
5.6.4 內建標籤分析 86
5.7 小結 95
第六章 結論 97
6.1 研究發現與結論 97
6.2 研究限制 99
6.3 未來研究方向 100
參考文獻 101
附錄A 109
附錄B 111


圖2.1.2-1 三大元素 9
圖2.1.4-1 標記的三大觀點 11
圖2.1.5-1 階層分類示意圖 13
圖2.1.5-2 對偶群眾分類法三元件 15
圖2.2.2-1 RSS格式範例 20
圖2.2.3-1 RSS架構圖 22
圖2.3.3-1 分支度 24
圖2.3.4-1 路徑長度 25
圖2.3.5-1 群聚度 26
圖2.4-1 k-核心 27
圖2.5.2-1 正規圖與隨機圖 31
圖3.1-1 研究流程圖 33
圖3.1-2 funP推推王網頁 35
圖3.2-1 資料收集流程圖 36
圖3.2-2 RSS閱讀器 37
圖3.2-3 自動化擷取網頁資料程式碼 37
圖3.4-1 資料庫實體關係圖 38
圖4.2-1 funP推推王書籤分類分佈 45
圖4.3-1書籤擁有標籤個數分佈 46
圖4.4-1 每日新增書籤分佈(以日為單位) 46
圖4.4-2每日新增書籤分佈(以時為單位) 47
圖4.5-1 使用者-網路資源 49
圖4.5-2 使用者-標籤 49
圖4.5-3網路資源-使用者 49
圖4.5-4網路資源-標籤 49
圖4.5-5 標籤-使用者 50
圖4.5-6 標籤-網路資源 50
圖4.6-1 與「部落格」共用標籤的分佈 53
圖5.1-1 使用者(標籤關聯)拓樸示意圖 57
圖5.1-2使用者(標籤關聯)拓樸示意圖(標籤共享比率) 58
圖5.1-3使用者(標籤關聯)拓樸示意圖(共享比率條件>=50%) 58
圖5.2-1 使用者使用頻率排名分佈 60
圖5.2-2 網路資源收藏頻率排名分佈 61
圖5.2-3 標籤標記頻率排名分佈 61
圖5.3-1 連通成份數分佈圖(使用者拓樸) 64
圖5.3-2 連通成份節點數分佈圖(使用者拓樸) 64
圖5.3-3 使用者k-核心拓樸(網路資源關聯) 65
圖5.3-4使用者k-核心拓樸(標籤關聯) 66
圖5.4-1 連通成份數分佈圖(網路資源拓樸) 68
圖5.4-2 連通成份節點數分佈圖(網路資源拓樸) 68
圖5.4-3 網路資源k-核心拓樸(使用者關聯) 69
圖5.4-4網路資源k-核心拓樸(標籤關聯) 70
圖5.6-1 連通成份數分佈圖(標籤拓樸) 76
圖5.6-2 連通成份節點數分佈圖(標籤拓樸) 76
圖5.6.2-1包含內建標籤k-核心拓樸圖(Top 20 使用者關聯) 82
圖5.6.2-2不包含內建標籤k-核心拓樸圖(Top 20 使用者關聯) 82
圖5.6.3-1包含內建標籤k-核心拓樸圖(Top 20 網路資源關聯) 84
圖5.6.3-2不包含內建標籤k-核心拓樸圖(Top 20 網路資源關聯) 85
圖5.6.4-1 Top 20 標籤(使用者關聯)拓樸共享比率分佈 87
圖5.6.4-2標籤(Top 20 網路資源關聯)拓樸共享比率分佈 88
圖5.6.4-3 Top 20 內建標籤(使用者關聯)節點群聚度分佈 89
圖5.6.4-4 Top 20 非內建標籤(使用者關聯)節點群聚度分佈 89
圖5.6.4-5 Top 20 內建標籤(網路資源關聯)節點群聚度分佈 90
圖5.6.4-6 Top 20 非內建標籤(網路資源關聯)節點群聚度分佈 90
圖5.6.4-7標籤(Top 20 使用者關聯)拓樸共享比率分佈 91
圖5.6.4-8標籤(Top 20 網路資源關聯)拓樸共享比率分佈 92
圖5.6.4-3 內建標籤(Top 20 使用者關聯)節點群聚度分佈 93
圖5.6.4-4 非內建標籤(Top 20 使用者關聯)節點群聚度分佈 94
圖5.6.4-5 內建標籤(Top 20 網路資源關聯)節點群聚度分佈 94
圖5.6.4-6 非內建標籤(Top 20 網路資源關聯)節點群聚度分佈 95


表2.1.3-1 國外社會性書籤網站整理資料表 10
表2.1.3-2 國內社會性書籤網站整理資料表 10
表2.2.2-1 RSS頻道資訊元素 20
表2.2.2-2 RSS新聞資訊元素 21
表3.1-1 funP推推王社會性書籤網站分類項目 35
表3.4-1 書籤資料表欄位設計 39
表3.4-2 使用者資料表欄位設計 39
表3.4-3 網路資源資料表欄位設計 40
表3.4-4 標籤資料表欄位設計 40
表4.1-1樣本統計數據表(2010/07/27~2010/08/27) 44
表4.5-1樣本統計數據表(2010/07/27至2010/08/02) 48
表4.5-2樣本敘述統計數據表 48
表4.5-3 連結關係趨勢線方程式參數 50
表4.6-1 Top 20使用者統計數據表 51
表4.6-2 Top 20標籤統計數據表(包含內建標籤) 51
表4.6-3 Top 20標籤統計數據表(不含內建標籤) 52
表4.6-4 Top 20 網路資源 54
表5.2-1三大元素使用頻率之敘述統計 59
表5.2-2 排名頻率趨勢線方程式 61
表5.3-1 使用者拓樸與網路資源拓樸樣本數據表 62
表5.3-2使用者2-核心拓樸(網路資源關聯)節點資料表 66
表5.3-3使用者5-核心拓樸(標籤關聯)節點資料表 66
表5.4-1網路資源16-核心拓樸(標籤關聯)節點資料表 70
表5.5-1 使用者拓樸與網路資源拓樸平均分支度 71
表5.5-2 使用者拓樸與網路資源拓樸最短平均路徑長度 71
表5.5-3 使用者拓樸與網路資源拓樸群聚度 72
表5.5-4 使用者拓樸與網路資源拓樸連通成份統整表 73
表5.5-5 使用者、網路資源拓樸平均分支度 74
表5.5-6 使用者、網路資源拓樸最短平均路徑長度 75
表5.5-7 使用者、網路資源拓樸平均群聚度(考慮內建標籤) 75
表5.6-1 標籤拓樸連通成份統整表 77
表5.6.1-1 Top 20 標籤拓樸樣本數據表 79
表5.6.1-2 Top 20標籤拓樸平均分支度 79
表5.6.1-3 Top 20標籤拓樸最短平均路徑長度 80
表5.6.1-4 Top 20標籤拓樸平均群聚度 80
表5.6.2-1 標籤(Top 20 使用者)拓樸樣本數據表 81
表5.6.2-2 標籤(Top 20 網路資源)拓樸樣本數據表 81
表5.6.2-1 標籤拓樸平均分支度(Top 20 使用者關聯) 83
表5.6.2-2 標籤拓樸最短平均路徑長度(Top 20 使用者關聯) 83
表5.6.2-3 標籤拓樸平均群聚度(Top 20 使用者關聯) 83
表5.6.3-1 標籤拓樸平均分支度(Top 20 網路資源關聯) 85
表5.6.3-2 標籤拓樸最短平均路徑長度(Top 20 網路資源關聯) 86
表5.6.3-3 標籤拓樸平均群聚度(Top 20 網路資源關聯) 86
表5.6.4-1 群聚度分佈數據統計表 95

