跳到主要內容

臺灣博碩士論文加值系統

(18.97.9.170) 您好!臺灣時間:2024/12/03 14:04
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

: 
twitterline
研究生:鄒達毅
研究生(外文):Da-Yi Tsou
論文名稱:利用文章內容分析輔助學習歷程探勘
論文名稱(外文):Mining Learning Portfolio by Using Documents Analyzing
指導教授:鍾斌賢鍾斌賢引用關係夏延德夏延德引用關係
指導教授(外文):Bin-Shyan JongYen-Teh Hsia
學位類別:碩士
校院名稱:中原大學
系所名稱:資訊工程研究所
學門:工程學門
學類:電資工程學類
論文種類:學術論文
論文出版年:2009
畢業學年度:97
語文別:中文
論文頁數:75
中文關鍵詞:輔助學習主題分類線上教學文字探勘
外文關鍵詞:Assisting studyingConcept classificationText miningOnline learning
相關次數:
  • 被引用被引用:0
  • 點閱點閱:450
  • 評分評分:
  • 下載下載:1
  • 收藏至我的研究室書目清單書目收藏:2
由於網路的蓬勃發展,線上教學已成為眾多輔助老師教學方式中,最主要的一種。線上學習有著不限時間、地點的特性,學生的線上學習行為如:上線次數、上線時間、閱讀教材的內容…等數據皆有學習歷程紀錄,因此有許多研究投入對學生線上活動及其學習成效之關係探討。
然而,線上行為的紀錄中累計型的數據例如:上線時間、上線次數…等並無法表現出學生在各觀念或是主題的學習成果,僅能代表學生於此平台上活動的時間長短;但因學習態度及學生資質不同,時間長並不能代表學習成效佳,時間短也未必學習不足。因此本研究著重於學生在線上活動中所發表的文章內容及相關數據之分析,希望藉由分析結果來預測學生學習不足的觀念或主題。
本研究的方式是將學生所發表的文章視為是對各觀念或主題的學習成果,將文章進行兩大部分的分類,1.針對文章的內容以文字探勘及統計等運算方式評比出客觀的數值以表現文章的好壞;2.對文章所代表的觀念或主題進行分類,以找出相同或類似內容的文章相互比較,並分析各文章發表人之間的學習成效,以找出學習不佳者。
老師亦可利用本系統所提供之介面,根據不同需求設定參數,及時修正對學生學習的分析。或利用本系統資料庫中對各時間點的分析資料與現在狀態的比較找出不同年度學生學習的差異,輔以補救教學教材或是提供更多學生學習較弱的主題的內容來補強。
本研究也利用現有的累積數據,對學生未來的學習成效進行預測,可提供老師可能學習失敗的學生名單,以便提早預防及提醒學生加強個人學習,使輔助學習的成效上更加完整。
Because of the flourishing development of the internet, online teaching has already become an important way of teacher's teaching. Online learning has not limited the time and place of the characteristics of students such as: login times, studying time, reading what kind of materials, such as data ... there are records of learning portfolios. There are lots of research has put into the online activities and explore the relationship between the effectiveness of learning.
However, the records of online behavior data in a cumulative-type such as: login times, studying time …can only represent student's time accident of the activity on this platform; Because of the attitude of study and student qualification are different to each students, To stay for a long time can not represent the best learning effect. So our research focused on the activities of students in the online publication of the article content and related data analysis, and hope to predict with the analysis result that students study insufficient idea or theme.
Our research is published by the students is considered an article on the concept or the theme of learning effect, and classification of two parts:
1. For the content of the articles in text mining and statistical algorithms, give each article a rating.
2. To represent the concept of the article or topic classification and find other articles which has similar topic or concept.
The teachers can also utilize the interface that this system offered, establish the parameter according to different demands, revise the analysis of studying about students in time. Or using the database to analyzing or compare the difference of every years data.
Our research can predict the learning effect by using the cumulative data that got in past years. In order to prevent and remained the students, we can make a student list that might be learn to fail in some concept. Teachers can use the list to give them more help.
目錄
摘要 I
Abstract II
誌謝 IV
表目錄 VII
圖目錄 VIII
第一章 序論 1
1.1研究動機 1
1.2研究目的 2
第二章 相關研究 4
2.1學習歷程 4
2.2文字探勘 4
2.2.1文字探勘的演進 4
2.2.2文字探勘與教學領域 6
2.3向量空間模型(Vector Space Model,VSM) 7
2.3.1關鍵字串建立(Key Words query) 10
2.4關鍵字權重(Term Frequency Inverse Document Frequency, TFIDF) 10
2.4.1字詞頻率(Term Frequency,TF) 11
2.4.2文件頻率(Document Frequency, DF)及反向文件頻率(Inverse Document Frequency, IDF) 11
2.5差異式潛在語義索引(Differential Latent Semantics Index, DLSI) 12
2.5.1利用差異式分群(Differential Clustering)進行相關度比較 13
2.6資料庫外的文件探勘與蒐集 14
2.7線上表現計分 14
2.8 相關度檢定 15
2.8.1 ANOVA檢定 15
2.8.2 Pearson檢定 15
第三章 系統架構 17
3.1文章內容探勘流程 17
3.2系統架構 18
3.2.1資料庫 18
3.2.2廢文過濾 19
3.2.3文章分類 19
3.3廢文處理 20
3.4使用者介面 21
第四章 實驗規劃 22
4.1實驗方法 22
4.1.1資料庫內容 22
4.1.2文章資訊分析 22
4.1.3實驗環境 23
4.1.4實驗對象 26
4.2問題與假設 26
4.3實驗規劃 27
4.3.1廢文過濾 27
4.3.2文章分類 27
4.3.3門檻值定義 27
4.3.4探討廢文與學生學習成效關係 28
4.4實驗結果 28
4.4.1初始資料庫內容 28
4.4.2歷年文章分析並將”課程討論區”文章過濾後加入資料庫 32
4.4.3實驗一:文章分析 36
4.4.4實驗二:學習成就與文章關係 50
第五章 結論與未來工作 61
5.1 結論 61
5.1.1過濾功能成效 61
5.1.2分類功能成效 61
5.1.3減低教師閱讀負擔 61
5.2未來工作 62
5.2.1與補救教學機制的結合 62
5.2.2效能改進 62
參考文獻 63





表目錄
表2-1 ANOVA檢定 15
表2-2 Pearson檢定 16
表4-1系統程式初始資料庫狀態 29
表4-2作業系統初始資料庫狀態 30
表4-3 95、96年度系統程式課程討論區分析結果 33
表4-4平均值±2個標準差所過濾出廢文及比例 34
表4-5 兩不同資料庫的資訊 35
表4-6初始資料庫平均值±2個標準差所過濾出廢文及比例 35
表4-7 95、96年度作業系統課程討論區分析結果 36
表4-8資料庫C及資料庫D的資訊 36
表4-9文章分析結果 37
表4-10資料庫A的文章分布 38
表4-11資料庫B的文章分布 38
表4-12預設分群 40
表4-13議題討論之分類結果 41
表4-14課程討論區之分類結果 42
表4-15文章過濾結果 45
表4-16資料庫C的文章分布 46
表4-17資料庫D的文章分布 46
表4-18作業系統預設分群 46
表4-19議題討論區之文章分布 49
表4-20課程討論區之文章分布 49
表4-21發表文章數量前15名學生發表文章狀態及成績 51
表4-22 平均成績統計 52
表4-23 考試平均與發表文章品質之檢定 52
表4-24學期成績與發表文章品質之檢定 53
表4-25考試平均之ANOVA檢定 53
表4-27 TFIDF高於15人平均者與其餘同學比較 54
表4-28 TFIDF低於15人平均者與其餘同學比較 55
表4-29 972作業系統課程學生發表文章與成績統計 56
表4-30文章數量與線上表現分數檢定 58
表4-31實驗組與對照組之考試平均檢定 58
表4-32實驗組與對照組之學期成績檢定 58
表4-33廢文較多之同學與其餘學生比較 59


圖目錄
圖2-1 KDD流程圖(U. Fayyad,1996) 5
圖2-2 三維向量空間模型 8
圖2-3 關鍵字變更後的向量空間模型 9
圖3-1 判斷流程圖 18
圖3-2系統圖 21
圖4-1中原網路學園登入畫面 24
圖4-2課程學習區 24
圖4-3課程討論區 25
圖4-4-1議題討論列表 25
圖4-4-2議題討論內容 26
圖4-5-1符合主題但無關鍵字的誤判 31
圖4-5-2符合主題但無關鍵字的誤判 31
圖4-6 議題討論區文章分布圖 42
圖4-7 課程討論區文章分布圖 43
圖4-8 972作業系統議題討論區文章分布 50
圖4-9 972作業系統課程討論區文章分布 50
圖4-10概念圖診斷系統整合 56
A. Vasilakopoulos, M. Bersani, and W. J. Black, A Suite of Tools for Marking Up Textual Data for Temporal Text Mining Scenarios. In LREC 2004, Lisbon, 2004.
C.C. Chang, A study on the evaluation and effectiveness analysis of web-based learning portfolio (WBLP). British Journal of Educational Technology. 32, 4, 435-458. 2001.
C. Santamaría, J. Gonzalo and F. Verdejo, Automatic association of Web directories with word senses. Computat. Ling. 29, 3, pp.485–502. 2003.
C. Tang, S. Dwarkadas, and Z. Xu, On Scaling Latent Semantic Indexing for Large Peer-to-Peer Systems, Proceedings of the ACM SIGIR'04, 2004.
C. Tempich, S. Staab, and A. Wranik, REMINDIN': Semantic Query Routing in Peer-to-Peer Networks based on Social Metaphors, Proceedings of the 13th Int. World Wide Web Conference, 2004.
C.C. Huang, K.M. Lin, L.F. Chien, Automatic Training Corpora Acquisition through Web Mining. IEEE/WIC/ACM, 2005.
C. Romero, S. Ventura, Educational data mining: A survey from 1995 to 2005, Expert Systems with Applications 33, 135–146, 2007.
D. Sullivan, Document Warehousing and Text Mining, Wiley Computer Publishing, pp.326, 2001.
D. S. Moore, Basic Practice of Statistics, WH Freeman Company, pp.90-114,2000.
G. Salton. and M.J. McGill, Introduction to Modern Information Retrieval. New York, NY: McGraw-Hill, 1983.
G. Salton, E.A. Fox, and H. Wu, Extended Boolean information retrieval. Commun. ACM 26, pp.1022–1036, 1983.
G. Salton, and C. Buckley , Term-weighting approaches in automatic text retrieval. Information Processing & Management 24(5): pp.513–523, 1988.
G. Tao, and K.F. Wong, KPS: a Web information mining algorithm. Computer Networks,31(11-16), pp. 1495-1507.1999.
G.J. Hwang , P.Y. Yin , T.T. Wang , Judy C.R. Tseng , and G.H. Hwang, An enhanced genetic approach to optimizing auto-reply accuracy of an e-learning system. Computers & Education 51, pp. 337–353, 2008.
H. Hotelling, Analysis of a Complex of Statistical Variables into Principal Components, Journal of Educational Psychology, Vol. 24, pp. 417-441, 498-520, 1993.
H. Schütze and C. Silverstein, Projections for efficient document clustering. In Proceedings of SIGIR’97, pp. 74–81, 1997.
H. Jin, X. Ning, H. Chen and Z. Yin, Efficient Query Routing for Information Retrieval in Semantic Overlays. ACM, 2006.
I.S. Dhillon and D.S. Modha, concept Decompositions for Large Sparse Text Data Using Clustering. Machine Learning, 42(1), pp. 143-175, Jan. 2001.
J. Dörre, P. Gerstl, and R. Seiffert, Text mining: finding nuggets in mountains of textual data. In Proc. 5th ACM Int. Conf. on Knowledge Discovery and Data Mining (KDD-99), San Diego, ACM Press, New York, US. pp. 398–401, 1999.
L. Crocker, J. Algina, Introduction to Classical & Modern Test Theory. Holt, Rinehart and Winston, 1986.
L. Chen, N. Tokuda, A. Nagai, A Differential LSI Method for Document Classification. ACL , pp.25–32 ,2003.
L. Chen, N. Tokuda and H. Adachi , A Patent Document Retrieval System Addressing Both Semantic and Syntactic Properties. Proceedings of the ACL-2003 workshop on Patent corpus processing, 2003.

N.J. Belkin, and P. Kantor, Combining the Evidence of Multiple Query Representations for Information Retrieval. TREC-2, 1994.
R. Cooley, B. Mobasher, and J. Srivastava, Web Mining:Information and Pattern Discovery on the World Wide Web, Proceedings of Ninth IEEE International Conference of Tools with Artificial Intelligence, pp.558 –567.1997.
S. Derwester, S.T. Dumais, G.W. Furnas, T.K. Landauer and R. Harshman, Indexing by latent semantic analysis. In J Amer Soc Inf Sci 1,6, ppp.391-407, 1990.
S. Karim, and A. M. Tjoa, Towards the use of ontologies for improving the user interaction for people with special needs, Proceedings of 10th International Conference on Computers Helping People with Special Needs, ICCHP'06, Springer, 4061, pp.77-84, 2006.
S. Harper, S. Bechhofer, SADIe: Structural semantics for accessibility and device independence. ACM Transactions on Computer-Human Interaction, ACM’14(10), 2007.
U. Fayyad, G. Piatetsky-Shapiro , and P. Smyth, From data mining to knowledge discovery in databases. AI Magazine, 17(3), 1996.
W. Wang, JF. Weng, JM. Su, SS. Tseng, Learning Portfolio Analysis and Mining in SCORM Compliant Environment. Frontiers in Education, 2004. FIE 2004, 34th Annual, 2004.
Z. Bar-Yossef and S. Rajagopalan, Template Detection via Data Mining and its Applications. In Proceedings of the 11th International World Wide Web Conference (WWW2002), 2002.
林清山,心理與教育統計學,東華書局出版,1992。
陳建銘,學習歷程探勘與思考風格於適性化補救學習之研究。中原大學
資訊工程系研究所碩士論文,2007。
李昭毅,利用學習歷程進行多元化適性補救之研究。中原大學資訊工程系研究所碩士論文,2008。
鄭宇廷,應用學習成就及適性化教材之合作學習研究。中原大學資訊工
程系研究所碩士論文,2008
王嬈媚,網路學習歷程分析應用於提升學習動機之研究,2008
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top