跳到主要內容

臺灣博碩士論文加值系統

(18.204.56.185) 您好!臺灣時間:2022/08/14 02:53
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:張廷仰
論文名稱:試題反應理論數量分析程序之研究─以「九十學年度四技二專統一入學測驗」護理類數學科為例─
指導教授:許天維許天維引用關係
學位類別:碩士
校院名稱:臺中師範學院
系所名稱:教育測驗統計研究所
學門:教育學門
學類:教育測驗評量學類
論文種類:學術論文
論文出版年:2002
畢業學年度:90
語文別:中文
論文頁數:96
中文關鍵詞:試題反應理論質的分析量的分析
外文關鍵詞:Item Response TheoryQualitative analysisQuantitative analysis
相關次數:
  • 被引用被引用:5
  • 點閱點閱:375
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:2
本研究主要目的在於提供一套有效可行的測驗統計分析程序,並供命題者與測驗專家從事命題改善之參考。本研究乃針對「九十學年度技術校院四年制與專科學校二年制統一入學測驗」護理類數學科之正式、完整、以及大量的測驗資料,用現代頗為流行的「試題反應理論」(簡稱IRT)來進行一系列的測驗統計分析。首先考驗護理類數學科之測驗資料是否符合IRT之單向性假設;其次針對護理類數學科之測驗資料進行傳統試題分析以及模式適合度考驗之工作;最後則針對護理類數學科之試卷進行個別試題分析與測驗題本分析之工作。個別試題分析又可分為質的分析與量的分析:質的分析方面,利用試題檢核表來加以檢核;量的分析方面,利用相關的電腦應用程式,對個別試題之計量特性加以分析,諸如難度、鑑別度、猜測度、正答力、及誘答力等。而測驗題本分析方面,則以信度及內容效度做為測驗品質優劣評鑑之指標。信度的分析,利用IRT的信度公式來加以詮釋;而內容效度的分析,則利用雙向細目表及內容效度檢核表來加以評鑑。最後,將上述研究程序實行之後,所獲得的研究結果呈現於論文內文之中,並針對研究所得之結論,提出未來研究的建議。
The main purpose of the research is to provide an effective testing statistic analytic process, and also to provide those who set questions and test experts with references that are used to improve questions. This research takes the formal, complete, and lots of testing materials of "The Mathematic Subject of Four-year Technical/Two-year-junior College Entrance Examination of 2001," and uses a quite popular way in nowadays-Item Response Theory (IRT)-to perform a series of testing statistic analyses. First of all, it examines if the mathematic subject''s testing data conforms to unidemensionality assumption of IRT. Secondly, it takes the mathematic subject''s testing data to conduct the classical item analysis and goodness-of-fit analysis. Finally, it takes the mathematic subject''s testing data and test papers to perform item analysis and test analysis separately. Item analysis can be divided into qualitative analysis and quantitative analysis: qualitative analysis is examined by item check list. Qualitative analysis is examined by relative computer programs, and analyzes the estimating peculiarity of item analysis, such as difficult, discrimination, pseudo-chance parameters, and option analysis, and so on. About test analysis, it uses reliability and content validity as the target to judge if this test quality is good or bad. The analysis of reliability is explained by IRT''s reliability formula. The analysis of content validity is showed by two-way specification table and content validity check list. Finally, after putting above research processes into practice, what we get will show in this paper. Moreover, we will propose the suggestions of future research according to the conclusion of the research.
目 錄
第一章 緒論…………………………………………………… 1
第一節 研究動機………………………………………………………… 1
第二節 研究目的與研究問題…………………………………………… 3
第三節 名詞釋義………………………………………………………… 5
第二章 文獻探討……………………………………………… 8
第一節 測驗理論探討…………………………………………………… 8
第二節 試題分析………………………………………………………… 27
第三節 測驗分析………………………………………………………… 31
第四節 IRT 電腦應用軟體……………………………………………… 40
第三章 研究方法與程序……………………………………… 45
第一節 研究對象………………………………………………………… 45
第二節 研究工具………………………………………………………… 46
第三節 研究程序………………………………………………………… 48
第四章 研究結果與討論……………………………………… 53
第一節 各項考驗與傳統試題分析之結果……………………………… 53
第二節 個別試題分析之結果…………………………………………… 58
第三節 測驗題本分析之結果…………………………………………… 69
第五章 結論與建議…………………………………………… 74
第一節 結論……………………………………………………………… 74
第二節 建議……………………………………………………………… 76
參考文獻………………………………………………………… 78
附錄………………………………………………………………84
附錄一 九十學年度四技二專護理類數學科雙向細目表...….……..………… 84
附錄二 技專校院入學測驗中心所編製之命題參考手冊中所列之命題原則、
命題注意事項以及試題檢核表.…………………………….………… 85
附錄三 選擇題型試題檢核表………….…………………………….………… 88
附錄四 選擇題型內容效度檢核表…….…………………………….………… 89
附錄五 九十學年度四技二專統一入學測驗護理類數學科測驗題本..……… 90
附錄六 SAS子程式Macro item用以進行選擇題傳統試題分析….………… 94
附錄七 SAS子程式Polychor用以產生四元相關係數矩陣以進行因素分析
...….……..…………………………….………………...……………… 95
附錄八 BILOG-MG for DOS洛吉數雙參數模式參數估計程式...…………… 96
表 目 錄
表2-1 二元名義變數與連續變數之間恰當的相關係數統計法……………… 22
表2-2 IRT 鑑別度等級分類表………………………………………………… 29
表4-1 護理類數學科測驗資料因素分析摘要表……………………………… 54
表4-2 傳統試題分析摘要表…………………………………………………… 55
表4-3 傳統試題分析答對率等級分類表……………………………………… 57
表4-4 傳統試題分析二系列相關係數等級分類表…………………………… 57
表4-5 護理類數學科測驗在各參數模式下的參數估計值與 統計表 …… 58
表4-6 IRT 雙參數模式下試題參數估計表…………………………………… 59
表4-7 IRT 雙參數模式下試題參數估計值平均數、標準差之摘要表……… 61
表4-8 IRT 雙參數模式下鑑別度等級分類表………………………………… 61
表4-9 題選項分析摘要表……………………………………………………… 62
表4-10 個別試題質的檢核之結果……………………………………………… 63
表4-11 九十學年度四技二專數學科護理類雙向細目表……………………… 71
表4-12 內容效度檢核結果……………………………………………………… 73
圖 目 錄
圖2-1 洛吉數雙參數模式之ICC……………………………………………… 16
圖2-2 洛吉數三參數模式之ICC……………………………………………… 18
圖3-1 研究流程圖……………………………………………………………… 49
圖4-1 陡坡檢驗圖……………………………………………………………… 54
圖4-2 傳統試題分析之答對率與二系列相關係數散佈圖…………………… 56
圖4-3 IRT 雙參數模式下難度與鑑別度之散佈圖…………………………… 60
圖4-4 九十學年度四技二專護理類數學科測驗訊息曲線圖………………… 70
參考文獻
壹、中文部份
王寶墉(民84)。現代測驗理論。台北市:心理出版社。
余民寧(民81)。試題反應理論的介紹(七)—訊息函數。研習資訊, 9卷,6期,頁5-9。
余民寧(民81)。試題反應理論的介紹(八)—測驗編製。研習資訊, 10卷,1期,頁6-10。
余民寧(民81)。試題反應理論的介紹(三)—試題反應模式及其特性。研習資訊, 9卷,2期,頁6-10。
余民寧(民81)。試題反應理論的介紹(五)—模式與資料間適合度的檢定。研習資訊, 9卷,4期,頁6-10。
余民寧(民81)。試題反應理論的介紹(四)—能力與試題參數的估計。研習資訊, 9卷,3期,頁6-12。
余民寧(民81)。試題反應理論的介紹—測驗理論的發展趨勢(一)。研習資訊, 8卷,6期,頁13-15。
余民寧(民81)。試題反應理論的介紹—測驗理論的發展趨勢(二)。研習資訊, 9卷,1期,頁5-8。
余民寧(民81)。試題反應理論的介紹—IRT的未來(十六)。研習資訊, 11卷,3期,頁7-11。
余民寧(民86)。教育測驗與評量-成就測驗與教學評量。台北市:心理出版社。
技專校院入學測驗中心(民90)。九十學年度技術校院四年制與專科學校二年制統一入學測驗之命題參考手冊。雲林縣:國立雲林科技大學。
李克明(民82)。測驗信度的基本原理─古典測驗理論的觀點。測驗統計年刊,創刊號,頁43-48。台中市:國立台中師範學院。
林清山(民84)。心理與教育統計學。台北市:東華書局。
洪碧霞(民81)。八十學年度大學入學考試社會組數學科題目分析IRT模式選擇之探討-兼論試題單維性及考生未作答行為之相關因素。臺南師院學生學刊,第14期,頁73。
洪碧霞、吳裕益、林哲彥、葉千綺(民81)。大學入學考試題目分析時IRT模式選擇之初探。台南師院測驗發展中心,EMC-TR-92-1。
張紹勳(民89)。SAS For Windows統計分析—初等統計。台北市:松崗書局。
張紹勳(民89)。SAS For Windows統計分析—高等統計。台北市:松崗書局。
張紹勳(民89)。SPSS For Windows統計分析—初等統計與高等統計(下冊)。台北市:松崗書局。
張紹勳(民89)。SPSS For Windows統計分析—初等統計與高等統計(上冊)。台北市:松崗書局。
教育部(民90)。技職教育白皮書。台北市:教育部技職司。
許天維(民90)。多元化評量的理論與實際。演講稿(未出版)。
許天維(民83)。數學試題分析法-「八十一學年國民教育階段國小組數學科基本成就評量」分析為例。高雄市:大漢唐有限公司。
許天維、殷志文(民84)。試題特徵曲線簡介。測驗統計簡訊雙月刊,第六期,頁1-7。台中市:國立台中師範學院。
許擇基、劉長萱(民80)。試題作答理論簡介。台北市:中國行為科學社。
郭生玉(民86)。心理與教育測驗。台北市:精華書局。
陳英豪、吳裕益(民79):測驗與評量。高雄市:復文圖書出版社。
彭昭英(民88)。SAS與統計分析。台北市:儒林書局。
彭昭英、唐麗英(民88)。SAS 1-2-3。台北市:儒林書局。
黃盟惠、張淑慧(民85)。項目反應理論應用於學術性向測驗之可行性探討。Chung Yuan Journal:Vol. 24, No. 2。頁5-12。
楊明宗(民91)。數學試題分析模式的建制—以「九十學年度四技二專入學測驗」商業類「數學科」試題為例。國立台中師範學院教育測驗統計所碩士論文,未出版,台中市。
趙素珍(民86)。BILOG-MG之簡介。測驗統計簡訊雙月刊,第十八期,頁34-44。台中市:國立台中師範學院。
劉湘川(民89)。點二系列相關試題鑑別指數之值譜分析及其在IRT上之應用。測驗統計年刊,第八輯,頁1-17。台中市:國立台中師範學院。
劉湘川、許天維、鄭富森(民87):IRT軟體估計精確度之比較。測驗統計年刊,第六輯,頁1-112。台中市:國立台中師範學院。
劉湘川、許天維等(民90)。技專校院九十學年度入學測驗各科命題分析研究計畫研究報告。國立雲林科技大學:技專校院入學測驗中心。
劉湘川、顧介梅(民90)。微積分選擇題型的試題檢核及其參考示例。測驗統計簡訊雙月刊,第四十四期,13-31頁。台中市:國立台中師範學院。
鄭富森(民82)。傳統試題分析原則與試題反應理論的關係。初等教育學刊,第2期,頁1-21。台北市:台北市立台北師範學院。
鄭蕙如(民90)。九年一貫課程數學領域評鑑工具發展之研究。國立臺灣師範大學教育心理與輔導學系碩士論文。
簡茂發(民82)。測驗的編製。測驗統計年刊,創刊號,頁13-22。台中市:國立台中師範學院。
貳、英文部份
Allen, M. J., & Yen, W. M. (1979). Introduction to measurement theory. Monterey, CA: Brooks/Cole.
Baker, F. B. (2001). The Basics of Item Response Theory. Retrieved March 29, 2002, from http://ericae.net/irt/baker/
Bashaw, W. L. (1982). Educational testing application of the Rasch Model. In C. Reynold (ed.). Handbook of School Psychology, xx-xxx.
Birnbaum, A. (1968). Statistical theories of mental test scores. Reading, MA: Addison Wesley.
Chernyshenko, S. & Stark, S. (2001, April). Using IRT Methods for Test Construction: Creating Parallel Forms. Retrieved March 30, 2002, from http://io.psych.uiuc.edu/siop2001/Test%20Construction%20IRT.ppt
Chong, H. Y. (2001). Developing Data Systems to Support the Analysis and Development of Large-Scale, On-line Assessment. Retrieved March 28, 2002, from http://research.ed.asu.edu/main/EDCARE/pro1-paper/developing.htm
Chong, H. Y. (n. d.). Using Perl, Bilog, SAS, and Data Desk to Visualize Item Characteristic Curves. Retrieved March 28, 2002, from http://seamonkey.ed.asu.edu/~alex/computer/sas/IRT.html
Chong, H. Y. (n. d.). Using SAS for Item Analysis and Test Construction I. Retrieved March 28, 2002, from http://seamonkey.ed.asu.edu/~alex/teaching/assessment/alpha.html
Chong, H. Y. (n. d.). Using SAS for Item Analysis and Test Construction II. Retrieved March 28, 2002, from http://seamonkey.ed.asu.edu/~alex/teaching/assessment/subscales.html
Chong, H. Y. (n. d.). Using SAS/Graph to Visualize Distractor Analysis. Retrieved March 28, 2002, from http://seamonkey.ed.asu.edu/~alex/computer/sas/distractor.html
Guion, R. M., & Ironson, G. H. (1983). Latent trait theory for organizational research. Organizational Behavior and Human Performance, 31, 54-87.
Haladyna, T. M. (1999). Developing and validating multiple-choice test items 2nd ed. Mahwah, NJ: Lawrence Erlbaum Associates.
Hambleton, R. K., & Swaminathan, H. (1985). Item response theory: Principles and applications. Boston, MA: Kluwer-Nijhoff.
Kaplan, R. M. & Saccuzzo, D. P. (1997). Psychological testing: principles, applications, and issues 4th ed. Monterey, CA: Brooks/Cole.
Lee, W. C., Stark, S., & Chernyshenko, S. (2001, April). Selecting IRT Models for Cognitve and Noncognitive Data. Retrieved March 30, 2002, from http://io.psych.uiuc.edu/siop2001/IRT%20basics.ppt
Lord, F. M. (1980). Application of item response theory to practical testing problems. Hillsdale, NJ: Lawrence Erlbaum Associates.
Lord, F. M. (1970). Estimating item characteristic curves without knowledge of their mathematical form. Psychometrika, 35, 43-50.
Lord, F. M. (1974). Estimation of latent ability and item parameters when there are omitted responses. Psychometrika, 39, 247-264.
Lord, F. M., & Novick, M. R. (1968). Statistical theory of mental test scores. Reading, Mass.: Addison-Wesley.
Osterlind, S. J. (1998). Constructing test items multiple-choice, Constructed-response, performance, and other formats. 2nd ed. Boston, MA: Kluwer Academic Publishers.
Rasch, G. (1960). Probabilistic models for some intelligence and attainment test. Copenhagen: Danmark Paedagogiske Institut (University of Chicago Press, 1980).
Recase, M. D. (1979). Unifactor latent trait models applied to multifactor tests: Results and implication. Journal of Educational Statistics, 4, 207-230.
Samejima, F. (1977). A use of the information function in tailored testing. Applied Psychological Measurement, 1, 233-247.
SAS Institure Inc. (2000). SAMPLE: Macro to create a matrix of polychoric correlations or distance matrix based on polychoric correlations. Retrieved March 29, 2002, from http://ftp.sas.com/techsup/download/stat/polychor.html
SAS Institure Inc. (2000). SAMPLE: Perform item analysis for multiple choice tests. Retrieved March 29, 2002, from http://ftp.sas.com/techsup/download/stat/item.html
Stark, S. & Chernyshenko, S. (2001, April). Examining Model-Data Fit Using Graphical and Statistical Methods. Retrieved March 30, 2002, from http://io.psych.uiuc.edu/siop2001/Model_Data%20Fit.ppt
Stephen Stark, Sasha Chernyshenko, David Chuah, Wayne C. Lee, & Patrick Wadlington. (2001). IRT Tutorial. Retrieved April 1, 2002, from http://work.psych.uiuc.edu/irt/
Wright, B. D. (1977). Solving measurement problems with the Rasch model. Journal of Euducational Measurement, 14, 97-116.
Wright, B. D. & Stone, M. H. (1979). Best test design. Chicago: MESA Press.
Yen, W. M. (1981). Using simulation results to choose a latent trait model. Applied Psychological Measurement, 5, 245-262.
Zimowski, M. F., Muraki, E., Mislevy, R. J. & Bock, R. D. (1996). BILOG-MG: Multiple-Group IRT Analysis and Test Maintenance for Binary Items. Chicago Scientific Software International Inc.
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
1. 趙素珍(民86)。BILOG-MG之簡介。測驗統計簡訊雙月刊,第十八期,頁34-44。台中市:國立台中師範學院。
2. 許天維、殷志文(民84)。試題特徵曲線簡介。測驗統計簡訊雙月刊,第六期,頁1-7。台中市:國立台中師範學院。
3. 李克明(民82)。測驗信度的基本原理─古典測驗理論的觀點。測驗統計年刊,創刊號,頁43-48。台中市:國立台中師範學院。
4. 余民寧(民81)。試題反應理論的介紹—IRT的未來(十六)。研習資訊, 11卷,3期,頁7-11。
5. 余民寧(民81)。試題反應理論的介紹—測驗理論的發展趨勢(二)。研習資訊, 9卷,1期,頁5-8。
6. 余民寧(民81)。試題反應理論的介紹—測驗理論的發展趨勢(一)。研習資訊, 8卷,6期,頁13-15。
7. 余民寧(民81)。試題反應理論的介紹(四)—能力與試題參數的估計。研習資訊, 9卷,3期,頁6-12。
8. 余民寧(民81)。試題反應理論的介紹(五)—模式與資料間適合度的檢定。研習資訊, 9卷,4期,頁6-10。
9. 余民寧(民81)。試題反應理論的介紹(三)—試題反應模式及其特性。研習資訊, 9卷,2期,頁6-10。
10. 余民寧(民81)。試題反應理論的介紹(八)—測驗編製。研習資訊, 10卷,1期,頁6-10。
11. 余民寧(民81)。試題反應理論的介紹(七)—訊息函數。研習資訊, 9卷,6期,頁5-9。
12. 廖明村、張豐藤,「垃圾焚化灰渣處理處置及資源化技術探討」,中興工程顧問公司,第125 ~ 136頁,民國八十七年。
13. 劉湘川(民89)。點二系列相關試題鑑別指數之值譜分析及其在IRT上之應用。測驗統計年刊,第八輯,頁1-17。台中市:國立台中師範學院。
14. 劉湘川、許天維、鄭富森(民87):IRT軟體估計精確度之比較。測驗統計年刊,第六輯,頁1-112。台中市:國立台中師範學院。
15. 劉湘川、顧介梅(民90)。微積分選擇題型的試題檢核及其參考示例。測驗統計簡訊雙月刊,第四十四期,13-31頁。台中市:國立台中師範學院。