跳到主要內容

臺灣博碩士論文加值系統

(3.236.28.137) 您好!臺灣時間:2021/07/25 19:50
字體大小: 字級放大   字級縮小   預設字形  
回查詢結果 :::

詳目顯示

我願授權國圖
: 
twitterline
研究生:王瓊珠
論文名稱:國民中學數學科段考試題分析之研究-以高雄巿某國中三年級為例
指導教授:張宏志 教授
學位類別:碩士
校院名稱:國立高雄師範大學
系所名稱:數學系
學門:數學及統計學門
學類:數學學類
論文種類:學術論文
論文出版年:2015
畢業學年度:103
語文別:中文
論文頁數:213
中文關鍵詞:測驗分析試題分析學生問題表分析
相關次數:
  • 被引用被引用:0
  • 點閱點閱:85
  • 評分評分:
  • 下載下載:0
  • 收藏至我的研究室書目清單書目收藏:0
摘 要
本研究之主要目的為針對「國民中學102學年度第二學期三年級第二次段考數學科試題」進行測驗分析、試題分析、學生問題表作差異係數與注意係數的分析,期盼藉由此份試題的編製與分析,不僅精進研究者編製測驗的能力,建立一套適當的測驗編製與分析的模式,並找出受試學生的學習盲點及學習困難,瞭解學生學習的情形,能對教師的命題與學生的學習有所助益,日後可提供教師教學建議及相關研究人員之參考。
本研究係利用102學年度第二學期的第二次段考數學科試題,以研究者所任教的高雄巿某國中三年級全體學生為研究對象,受試學生人數為813人,正式施測後有部分未畫記或所有試題均畫同一選項的答案卡30張,視為無效樣本,扣除後的有效樣本為783份。茲將研究結果摘述如下:
一、由內部一致性方法,求出折半信度係數值為 .914、Cronbach α信度係數值為 .910、 信度係數為 .910;以及信度曲線圖,得知本測驗具有不錯的信度。
二、由審題問卷結果、雙向細目表來看,本測驗具有良好的內容效度;由效標關聯係數(I)為 .9103,效標關聯係數(II)為 .8483的結果,得知本測驗具有不錯的效度。
三、以古典測驗理論分析,試題的難度平均值為 .621,鑑別度平均值為 .616,多數試題屬難易適中偏易的試題,且鑑別度優良。
四、以試題反應理論分析,BILOG-MG3.0三參數特徵曲線的難度平均值為 、鑑別度平均值為1.537、猜測度平均值為 .221,多數試題屬難易適中且鑑別度優良的試題;由TestGraf98選項特徵曲線得知,多數試題之選項具有良好的誘答力。
五、以學生問題表分析,各班差異係數平均值為 .4524,表示試題的異質成分不高;由學生屬性診斷分析顯示,多數受試學生的學習穩定;由試題屬性診斷分析顯示,多數試題為良好試題。




關鍵詞:測驗分析、試題分析、學生問題表分析

目錄
第一章 緒論……………………………………………………………………………1
第一節 研究背景與動機………………………………………………….…….1
第二節 研究目的與待答問題……………………………….……………….…4
第三節 名詞釋義………………………………………….……………….……4
第四節 研究範圍與限制………………………………………………………..5
第二章 文獻探討..……………………………………………………………………7
第一節 測驗的編製……………………………………………………………..7
第二節 測驗理論………………………………………………………………21
第三節 測驗分析與試題分析…………………………………………………44
第四節 學生問題表分析理論…………………………………………………64
第三章 研究設計與實施..…………………………………………………………75
第一節 研究架構……………………………………………………………....75
第二節 研究對象………………………………………………………………76
第三節 研究工具……………………………………………………………....76
第四節 研究法……………..…………………………………………………..81
第五節 資料處理與分析………………….…….……………………………..82
第六節 研究程序……………..………………………………………………..83
第四章 結果分析與討論..…………………………………………………………85
第一節 測驗分析………………………………………………………………85
第二節 試題分析………………..…………………………………………..…88
第三節 學生問題表分析………..…………………………………………....156


第五章 結論與建議………………………………………………………………163
第一節 結論…………………………………………………………………..163
第二節 建議…………………………………………………………………..164
參考書目…………………………………………………………………………………167
一、中文部分………………………………………………………………………………167
二、英文部分………………………………………………………………………………169
附錄一 「國民中學102學年度第二學期三年級第二次段考數學科試題」之審題問卷………………………………………………………………………………175
附錄二 「國民中學102學年度第二學期三年級第二次段考數學科試題」試卷…180
附錄三 TESTER for Windows 3.0 程式之各班S-P表分析…………………………186















表次
表2-1 三種試題反應模式的試題訊息函數之相關特性計算公式……………………37
表2-2 六個試題的試題參數值…………………………………………………………38
表2-3 信度參考指標……………………………………………………………………52
表2-4 難度等級評定表…………………………………………………………………58
表2-5 鑑別度等級評定表………………………………………………………………60
表2-6 S-P原表.…………………………………………………………………………65
表2-7 S-P原表(將學生排序後).……………………………………………………66
表2-8 S-P原表(將試題排序後).……………………………………………………67
表2-9 S-P表.……………………………………………………………………………67
表3-1 審題教師年資次數分配表………………………………………………………77
表3-2 「國民中學102學年度第二學期三年級第二次段考數學科試題」試卷之適合
度檢核結果表……………………………………………………………………79
表3-3 雙向細目表………………………………………………………………………81
表4-1 各試題刪題後的Cronbach α值…………………………………………………86
表4-2 103年國中教育會考數學科能力等級加標示與答對題數轉換分數對照表.…88
表4-3 「國民中學102學年度第二學期三年級第二次段考數學科試題」CTT分析結
果…………………………………………………………………………………89
表4-4 雙向細目表與通過率之分析表…………………………………………………91
表4-5 試題的難度等級分析表…………………………………………………………92
表4-6 試題的鑑別度等級分析表………………………………………………………93
表4-7 「國民中學102學年度第二學期三年級第二次段考數學科試題」IRT-3PL分析
結果………………………………………………………………………………94
表4-8 第1題試題分析表………………………………………………………………96
表4-9 第2題試題分析表………………………………………………………………98
表4-10 第3題試題分析表..……………………………………………………………100
表4-11 第4題試題分析表..……………………………………………………………102
表4-12 第5題試題分析表..…..……………………………..…………..………...…...104
表4-13 第6題試題分析表..……………………………………………………………106
表4-14 第7題試題分析表..……………………………………………………………108
表4-15 第8題試題分析表..……………………………………………………………110
表4-16 第9題試題分析表..……………………………………………………………112
表4-17 第10題試題分析表……………………………………………………………114
表4-18 第11題試題分析表……………………………………………………………116
表4-19 第12題試題分析表……………………………………………………………118
表4-20 第13題試題分析表……………………………………………………………120
表4-21 第14題試題分析表……………………………………………………………122
表4-22 第15題試題分析表……………………………………………………………124
表4-23 第16題試題分析表……………………………………………………………126
表4-24 第17題試題分析表……………………………………………………………128
表4-25 第18題試題分析表……………………………………………………………130
表4-26 第19題試題分析表……………………………………………………………132
表4-27 第20題試題分析表……………………………………………………………134
表4-28 第21題試題分析表……………………………………………………………136
表4-29 第22題試題分析表……………………………………………………………138
表4-30 第23題試題分析表……………………………………………………………140
表4-31 第24題試題分析表……………………………………………………………142
表4-32 第25題試題分析表……………………………………………………………144
表4-33 第26題試題分析表……………………………………………………………146
表4-34 第27題試題分析表……………………………………………………………148
表4-35 第28題試題分析表……………………………………………………………150
表4-36 第29題試題分析表……………………………………………………………152
表4-37 第30題試題分析表……………………………………………………………154
表4-38 各班差異係數表...………………………………………………………………157
表4-39 各班學生屬性診斷分析的學習類型統計表…...………………………………158
表4-40 各試題屬性診斷分析的試題類型統計表...……………………………………160




















圖次
圖2-1 典型的單參數試題特徵曲線……………………………………………………26
圖2-2 典型的雙參數試題特徵曲線……………………………………………………28
圖2-3 典型的三參數試題特徵曲線……………………………………………………30
圖2-4 選項特徵曲線 1…………………………………………………………………32
圖2-5 選項特徵曲線 2…………………………………………………………………33
圖2-6 選項特徵曲線 3…………………………………………………………………33
圖2-7 選項特徵曲線 4…………………………………………………………………34
圖2-8 試題訊息函數……………………………………………………………………38
圖2-9 典型的S曲線和P曲線之圖形…………………………………………………69
圖2-10 學生診斷分析圖…………………………………………………………………73
圖2-11 試題診斷分析圖…………………………………………………………………74
圖3-1 研究架構圖………………………………………………………………………75
圖4-1 信度曲線圖………………………………………………………………………87




參考書目
一、中文部分
方秀惠(2003)。題庫難度與先前能力分配對適性測驗效率之研究(未出版之碩士論文)。
國立高雄師範大學,高雄市。
余民寧(2009)。試題反應理論(IRT)及其應用。台北市:心理。
余民寧(2013)。教育測驗與評量-成就測驗與教學評量(三版)。新北市:心理。
吳慧珉(2001)。選項特徵曲線之研究-以核函數之平滑化為估計取向(未出版之碩士
論文)。國立台中師範學院,台中市。
呂秋文(1987)。S-P 表注意係數在數學科教學上之應用研究。政大學報,56,61-92。
周文欽、歐滄和、許澤基、盧欽銘、金樹人、范德鑫(1997)。心理與教育測驗。台北
市:心理。
高雄巿政府教育局(2013)。高雄市國民中小學學生學習診斷與進展評量實施計畫。高
雄巿:教育局。
許天維、殷志文(1995)。試題特徵曲線簡介。測驗統計簡訊,6,1-6。
郭生玉(2003)。心理與教育測驗(十六版)。台北縣:精華。
教育部(2014)。十二年國民基本教育。台北巿:教育部。2014年9月1日,取自
http://12basic.edu.tw/。
陳李綢(1997)。教育測驗與評量。台北市:五南。
陳映延(2012)。100學年度數學科學習成就測驗試題分析之研究-以新北巿某高職一年
級為例(未出版之碩士論文)。國立高雄師範大學,高雄市。
陳柏熹(2006)。IRT 在量表(測驗)編製上的應用(上)。2011年8月20日,取自
http://www.rcpet.ntnu.edu.tw/download.htm。
陳英豪、吳裕益(2001)。測驗與評量(六版)。高雄市:復文。
陳騰祥(1986)。S-P 表分析在學習診斷的應用及其實作感受之探究。彰化師大輔導學
報,9,275-311。
陳騰祥(1988)。S-P 表分析理論及其在學習評鑑上教師命題技術改進態度的效用之探
究。彰化師大輔導學報,11,1-69。
黃幸美(1996)。數學科新課程學習評量之探討。國民小學數學科新課程學習評量方法
之初探,15-21。台灣省國民學校教師研習會,台北縣。
傅粹馨(1998)。信度、Alpha 係數與相關議題之研究。教育學刊,18,163-184。
楊志強、楊志堅(2003)。選項特徵曲線在科學教育評量之應用(頁141-150)。應用
學科技於科學教育學術研討會,國立嘉義大學。
蔡元忠(2010)。數學科學習成就測驗試題分析與測驗分析之研究(未出版之碩士論文)。
國立高雄師範大學,高雄市。
簡茂發(1978)。信度與效度。載於楊國樞主編:社會及行為科學研究法(上冊)(頁323-351)。台北巿:東華。
簡茂發(1991)。命題方法與試題分析。國教輔導,31(1),2-13。
簡茂發(1993)。測驗的編製。測驗統計年刊,1,13-32。












二、英文部分
Ahmanan, J. S., & Glock, M. D. (1981). Evaluating student progress: Principles of tests and measurement (6th ed.). Boston, MA: Allyn & Bacon.
Anastasi, A. (1988). Psychological Testing (6th ed.). New York: Macmillan.
Bloom, B. S. et al. (Eds) (1956). Taxonomy of educational objectives: Cognitive domain. New York: David Mckay.
Birnbaum, A. (1968). Some latent trait models and their use in inferring an examinee’s ability.
In F. M. Lord, F. M., & Novick, M. R. (Eds.), Statistical theories of mental test scores.
Reading, MA: Addison-Wesley.
Brown, W. (1910). Some experimental results in the correlation of mental abilities.British Journal of Psychology, 3, 296-322.
Chase, C. I. (1978). Measurement for educational evaluation (2nd ed.). Reading, MA:
Addison-Wesley.
Crocker, L., & Algina, J.(1986). Introduction to classical and modern test theory. New York:
Holt, Rinehart & Winston.
Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests.Psychometrika, 16,
297-334.
Cronbach, L. J. (1990). Essentials of psychological testing (5th ed.). New York: Harper &
Row.
De Gruijter, D. N. M. (1986). Small N does not always justify the Rasch model. Applied
Psychological Measurement, 10, 187-194.
Devellis, R. F. (2012). Scale development: theoty and applications (3rd ed.).Los Angeles:
SAGE.
Ebel, R. L., & Frisbie, D. A. (1991). Essentials of educational measurement (5th ed.).
Englewood Cliffs, NJ: Prentice-Hall.
Fan, C. T. (1952). Item analysis table. Princeton, NJ:Educational Testing Service.
Flanagan, J. C. (1937). A proposed procedure for increasing the efficiency of objective tests. Journal of Educational Psychology, 28, 17-21.
Gronlund, N. E. (1976). Measurement and Evaluation in Teaching (3rd ed.) (p.81). Appeton-
Century-Crofts: New York.
Gronlund, N. E. (1993). How to make achievement tests assessments(5th ed.). Boston: Allyn
& Bacon.
Guilford, J. P.(1954). Psychometric methods. New York: McGraw-Hill.
Guion, R. M., & Ironson, G. H. (1983). Latent trait theory for organizational research.
Organizational Behavior and Human Performance, 31, 54-87.
Gulliksen, H. (1987). Theory of mental test. Hillsdale, NJ: Lawrence Erlbaum Associates.
(Originally published in 1950 by New York: John Wiley & Sons)
Guttman, L. A. (1944). A basis for scaling qualitative data. American Sociological Review,9,
139-150.
Haladyna, T.M. (1994). Developing and validating multiple-choice test items. Hillsdale, NJ:
Lawrence Erlbaum Associates.
Hambleton, R. K., (1989). Principles and selected applications of item response theory.In R. L.
Linn. (Ed.), Educational measurement (3rd ed.)(pp. 147-200). New York:Macmilla.
Hambleton, R. K., & Cook, L. L. (1977). Latent trait models and their use in the analysis of
educational test data. Journal of Educational Measurement, 14, 75-96.
Hambleton, R.K., & Swaminathan, H.(1985). Item response theory: Principles and
applications. Boston: Kluwer.
Hambleton, R. K., Swaminathan, H., & Rogers, H. J. (1991). Fundamentals of item response
theory. Newbury Park, CA:Sage.


Henson, R. K. (2001). Understanding internal consistency reliability estimates: A conceptual primer on coefficient alpha. Measurement and Evaluation in Counseling and Development, 34, 177-189.
Holin, C. L., Lissak, R. I., & Drasgow, F. (1982). Recovery of two-and three-parameter
logistic item characteristic curves:A Monte Carlo study. Applied Psychological
Measurement, 6, 249-260.
Hopkins, K. D., Stanley, J. C., & Hopkins, B, R. (1990). Educational and psychological
measurement and evaluation (7th ed.). Englewood Cliffs, NJ: Prentice Hall.
Kelly, T. L. (1939). The selection of upper and lower groups for the validation of test items.
Journal of Educational Psychology, 30, 17-24.
Kibler, R. J. (1978). Objectives for instruction and evaluation. Boston:Allyn and Bacon.
Kuder, G. F., & Richardson, M. W. (1937). The theory of estimation of test reliability.
Psychometrika, 2, 151-160.
Lord, F. M. (1952). A theory of test scores. Psychometric Monograph, No. 7.
Lord, F. M. (1974). Estimation of latent ability and item parameters when there are omitted
responses. Psychometrika, 39, 247-264.
Lord, F. M. (1980). Applications of item response theory to pratical testing problems.
Hillsdale, NJ: Lawrence Erlbaum Associates.
Lord, F. M., & Novick, M. R.(1968). Statistical theories of mental test scores. Reading, MA
:Addison-Wesley.
National Assessment of Educational Progress (2011).Mathematics Framework for the 2011 National Assessment of Educational Progress.Retrieved from http://www.nagb.org/ content/nagb/assets/documents/publications/frameworks/math-2011-framework.pdf
Noll, V. H., Scannell, D. P., & Craig, R. C. (1979). Introduction to educational measurement
(4th ed.)(p. 210). Boston, MA: Houghton Mifflin.

Novick, M., & Lewis, G. (1967). Coefficient alpha and the reliability of composite measurements. Psychometrika, 32, 1-13.
Oosterhof, A. (2001). Classroom applications of educational measurement (3rd ed.). Upper
Saddle River, NJ: Prentice-Hall.
Osterlind, S. J. (1998). Constructing test items:Multiple-choice, constructed-response, performance, and other formats (2nd ed.). Boston: Kluwer Academic Publishers.
Ory, J. C., & Ryan, K. E.(1993). Tips for improving testing and grading. Newbury Park, CA:
Sage.
Ramsay, J. O. (1991). Kernel smoothing approaches to nonparametric item characteristic
curve estimation. Psychometrika, 56, 611-630.
Rasch, G. (1980). Probability models for some intelligence and attainment tests. Chicago:
The University of Chicago Press (Original edition publised in 1960).
Reckase, M. D. (1979). Unifactor latent trait models applied to multi-factor test: Results and
implications. Journal of Educational Statistics, 4,207- 230.
Richardson, M. W. (1936). the relationship between difficulty and the differential validity of a
test. Psychometrika, 1, 33-49.
Roid, G. H., & Holadyna, T. M. (1982). A technology for test-item writing. Orlando, FL:
Academic Press.
Rulon, P. J. (1939). A simplified procedure for determining the reliability of a test by split halves. Harvard Educational Review, 9, 99-103.
Sato, T. (1969). A method of analyzing data gathered by the Response Analyzer for diagnosis
of student performance and the quality of instructional sequence. Proceedings of IECE
of Japan annual conference S12-1(In Japanese).
Sato, T. (1971). Analysis of students’ performance score data. In K. Hirata, & T. Sato (Eds.),
Response Analyzer (pp. 79-96). Tokyo: Kyoiku-Kogakusha. (In Japanese).

Sato, T. (1975). The construction and interpretation of S-P tables. Tokyo: Meiji Tosho (In
Japanese).
Sato, T. (1980). The S-P chart and the caution index. NEC Educational Information Bulletin, 80-1.
Sato, T. (1980a). Data analysis methods for instructional design and evaluation. Tokyo: Meiji
Tosho (In Japanese).
Sato, T. (1980b). The S-P chart and the caution index. NEC Educational Information Bulletin,
80(1), C&C Systems Research Laboratories, Nippon Electric Co., Ltd.,Tokyo, Japan (In
Japanese).
Sato, T. (1985). Introduction to student-problem curve theory analysis and evaluation.Tokyo:
Meiji Tosho (In Japanese).
Shepard, L. A., Camilli, G., & Williams, D. M. (1984). Accounting for statistical artifacts in
item bias research. Journal of Educational Statistics, 9, 93-128.
Spearman, C. (1910). Correlation calculated from faulty data. British Journal of Psychology,
3, 271-295.
Suen, H. K. (1990). Principles of test theories. Hillsdale, NJ: Lawrence Erlbaum Associates.
Swaminathan, H., & Gifford, J. A. (1983). Estimation of paramenters in the threeparameter
latent trait model. In D. Weiss (Ed.), New horizons in testing (pp. 13-30).New York:
Academic Press.
Terman, L. M. (1916). The measurement of intelligence. Bostin, MA: Houghton Mifflin.
Thurstone, L. L. (1929). Theory of attitude measurement. Psychological Bulletin, 36,222-241.
Tucker, L. R. (1946). Maximum validity of a test with equivalent items. Psychometrika,11,
1-13.
Wright, B. D.(1977). Solving measurement problems with the Rasch model. Journal of
Educational Measurement, 14, 97-116.

Wright, B. D., & Stone, M. H. (1979). Best test design. Chicago: MESA Press.Yen, W. M.
(1992). Item response theory. In M. Alkin (Ed.), Encyclopedia of educational research
(6th ed.)(pp. 657-667). New York:Macmillan.



連結至畢業學校之論文網頁點我開啟連結
註: 此連結為研究生畢業學校所提供,不一定有電子全文可供下載,若連結有誤,請點選上方之〝勘誤回報〞功能,我們會盡快修正,謝謝!
QRCODE
 
 
 
 
 
                                                                                                                                                                                                                                                                                                                                                                                                               
第一頁 上一頁 下一頁 最後一頁 top
無相關點閱論文