一、中文部分
王文科(1993)。教育研究法。台北市:五南圖書出版有限公司。
方秀惠(1993)。題庫難度與先前能力分配對適性測驗效率之研究。國立高雄師範大學資訊教育研究所碩士論文,未出版。余民寧(1993)。次序性資料的內容效度係數和同質性信度係數之計算。測驗年刊,40,199-214。余民寧(2011a)。教育測驗與評量-成就測驗與教學評量(三版)。新北市:
心理。
余民寧(2011b)。試題反應理論(IRT)及其應用。台北市:心理出版社。
余民寧,李敦仁(2007),學習表現的知識結構評量研究:
以「教育統計學」學科知識為例,教育研究與發展期刊(第三卷第四期)。
吳明隆(2006)。SPSS統計應用學習實務。台北市:知城數位科技。
呂秋文(1987)。S-P表注意係數在數學科教學上之應用研究。政大學報,56,61-92。
邱皓政(2006)。量化研究法(二):統計原理與分析技術(修訂版,頁15-13),台北市:雙葉書廊。
周文欽、歐滄和、許澤基、盧欽銘、金樹人、范德鑫(1995)。心理與教育測驗(初版一刷)。台北市:心理出版社。
林子幼(2002)。「國小三年級數學科正整數乘法概念」-探究以試題選項特徵曲線為分析基礎。國立台中師範學院數學教育學系碩士論文,未出版,台中市。侯傑泰,何穎欣(2008),學習回饋及系統監察:香港的經驗,教育研究與發展期刊(第四卷第四期)。洪碧霞 ,林素微 ,林娟如 (2006),認知複雜度分析架構對TASA-MAT六年級線上測驗試題難度的解釋力,教育研究與發展期刊(第二卷第四期)。郭生玉(2003)。心理與教育測驗(十六版)。台北縣:精華。
陳騰祥(1986)。S-P表分析在學習診斷的應用及其實作感受之探究。彰化師大輔導學報,9,275-311。陳騰祥(1988)。S-P表分析理論及其在學習評鑑上教師命題技術改進態度的效用之探究。彰化師大輔導學報,11,1-69。陳英豪、吳裕益(1991)。測驗與評量。高雄市:復文書局。
張海潮(2003)。九年一貫數學綱要必須重整。檢索日期:民國92年1月1日。取自:http://www.math.ntu.tw/library/math_general/article_03_01_ 16b.htm.
張佳琳(2013),美國國家課程時代的來臨:各州共同核心標準之探究,教育研究與發展期刊第九卷第二期,頁1-32。教育部(2003)。公佈新修國民中小學數學課程綱要。檢索日期:民國93年
2月11日。取自:http://140.122.120.230/ejedata/kying/20031211525/921201.htm
黃國清 (2006),台南市九年一貫課程七年級數學領域
成就測驗之編製與其相關之研究教育研究與發展期刊(第二卷第四期)。
曾建銘,陳清溪(2007),年臺灣學生學習成就評量結果之分析,教育研究與
發展期刊(第五卷第四期)。
彭森明(2006),學習成就評量的多元功能及其相應研究設計,教育研究與發展
期刊(第二卷第四期)。
楊志堅(2003)。選項特徵曲線在科學教育評量之應用。應用教學科技於科學教育學術研討會,國立嘉義大學(嘉義市)。
詹紹威(2012),美國共同核心州課程標準倡議之探討,教育研究與發展期刊,第八卷第二期 頁183-202蔡清田(2003)。九年一貫課程的評鑑意義、範圍與行動途徑。檢索日期:
民國93年2月1日。取http://www.trd.org.tw/Dresource/NINE /10_1.htm.
蔡元忠(2010)。數學科學習成就測驗試題分析與測驗分析之研究(未出版之碩士 論文)。國立高雄師範大學,高雄市。謝祥宏、段曉林(2001)。教學與評量:一種互為鏡像(mirror image)的關係。
科學教育月刊,241,2-13。
簡茂發(1978)。信度與效度。載於楊國樞主編:社會及行為科學研究法(上冊(頁323-351)。台北:東華書局。
簡茂發(1991)。命題方法與試題分析。國教輔導團,第31卷第1期,2-13。簡紅珠 (2006),優質教學釋義與啟示,教育研究與發展期刊(第二卷第二期)。二、英文部分
Aiken, L. R. (1980). Content validity and reliability of single items or questionnaires. Educational and Psychological Measurement, 40, 955-959.
Ahmanan, J. S., &; Glock, M. D. (1981). Evaluating student progress: Principles of tests and measurement (6th ed.). Boston, MA: Allyn &; Bacon.
Aiken, L. R. (1985). Three coefficients for analyzing the reliability and validity of
ratings. Educational and Psychological Measurement, 45, 131-142.
applications. Boston, MA: Kluwer-Nijhoff.
Anastasi, A. (1988). Psychological Testing (6th ed.). New York: Macmillan.
Crocker,L.&;Algina,J.(1986).Interduction to classical and modern test theory.NY:CBS.
Birnbaum, A. (1968). Some latent trait models and their use in inferring an examinee’s ability. In F. M. Lord &; M. R. Novick (Eds.), Statistical theories of mental test scores (chapters 17-20, pp. 397-479). Reading, MA: Addirson-Wesley.
Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika, 16, 297-334.
Carmines, E. G., &; Zeller, R. A. (1979). Reliability and validity assessment. Beverly Hills, CA: Sage.
Ebel, R. L., &; Frisbie, D. A. (1991). Essentials of educational measurement (5th ed.).
Englewood Cliffs, NJ: Prentice-Hall.
Glaser, R. (1962). Psychology and instructional technology. In R. Glaser (Ed.),
Training, research, and education. University of Pittsburgh Press
Gronlund, N. E. (1993). How to make achievement tests assessments. (5th ed.)Boston: Allyn &; Bacon.
Gutstein, E. (2010). The Common Core State Standards initiative: A critical
response. Journal of Urban Mathematics Education. Vol. 3, No. 1, pp. 9–18.
Retrieved from http://ed-osprey.gsu.edu/ojs/index.php/JUME/article/viewFile
/88/43.
Hambleton, R. K., &; Cook, L. L. (1977). Latent trait models and their use in the analysis of educational test data. Journal of Educational Measurement, 14, 75-96.
Hambleton, R. K., &; Swaminathan, H. (1985). Item response theory: Principles and applications. Boston, MA: Kluwer-Nijhoff.
Hopkins, K. D., Stanley, J. C., &; Hopkins, B, R. (1990). Educational and psychological measurement and evaluation (7th ed.). Englewood Cliffs, NJ: Prentice Hall.
Kuder, G. F., &; Richardson, M. W. (1937). The theory of the estimation of reliability. Psychometrika, 2, 121-160.
Kendall, M. G. (1970). Rank correlation methods (4th ed.). London: Griffin.
Lord, F. M. (1980). Applications of item response theorey to pratice testing problems. Hillsdale, NJ: Lawrence Erlbaum Associates.
Linn R. L.(2005). Test-based educational accountability in the era of no child left behind.(CRESST Tech. Rep. No. 651). Los Angeles, CA: University of California, National Centerfor Research on Evaluation, Standards, and Student Testing (CRESST).
Novick, M., &; Lewis, G. (1967). Coefficient alpha and the reliability of composite measurements. Psychometrika, 32, 1-13.
Noll, V. H., Scannell, D. P., &; Craig, R. C. (1979). Introduction to educational measurement (4th ed.). Boston, MA: Houghton Mifflin.
Ory, J. C., &; Ryan, K. E.(1993). Tips for improving testing and grading. Newbury Park, CA: Sage.
Rovinelli, R. J., &; Hambleton, R. K. (1977). On the use of content specialists in the assessment of criterion-referenced test item validity. Dutch Journal for Educational Research, 2, 49-60.
Rasch, G. (1980). Probability models for some intelligence and attainment tests. Chicago: The University of Chicago Press (Original edition publised in 1960).
Ramsay, J. O. (1991). Kernel smoothing approaches to nonparametric item characteristic curve estimation. Psychometrika, 56, 611-630.
Swaminathan, H., &; Gifford, J. A. (1983). Estimation of parameters in the three-parameter latent trait model. In D. Weiss (Ed.), New horizons in testing (pp. 13-30). New York: Academic Press.
Shepard, L. A., Camilli, G., &; Williams, D. M. (1984). Accounting for statistical artifacts in item bias research. Journal of Educational Statistics, 9,93-128.
Sato, T. (1969). A method of analyzing data gathered by the Response Analyzer for diagnosis of student performance and the quality of instructional sequence. Proceedings of IECE of Japan annual conference S12-1. (In Japanses)
Sato, T. (1971). Analysis of students’ performance score data. In K. Hirata, &; T. Sato (Eds.), Response Analyzer (pp.79-96). Tokyo: Kyoiku-Kogakusha. (In Japanses)
Sato, T. (1975). The construction and interpretation of S-P tables. Tokyo: Meiji Tosho. (In Japanses)
Sato, T. (1980a). Data analysis methods for instructional design and evaluation. Tokyo: Meiji Tosho. (In Japanses)
Sato, T. (1980b). The S-P chart and the caution index. NEC Educational Information Bulletin, 80-1.
Sato, T. (1985). Introduction to student-problem curve theory analysis and evaluation. Tokyo: Meiji Tosho. (In Japanses)