一、中文部分
王寶墉(1995)。現代測驗理論。台北:心理出版社。
余民寧(1992a)。試題反應理論的介紹(一)-測驗理論的發展趨勢。研習資訊,8(6),13-18。余民寧(1992b)。試題反應理論的介紹(二)-基本概念和假設。研習資訊,9(1),5-9。
余民寧(1992c)。試題反應理論的介紹(五)-模式與資料間適合度的檢定。研習資訊,9(4),6-10。余民寧(2002)。教育測驗與評量-成就測驗與教學評量。台北:心理出版社。
邱上真、洪碧霞、葉千綺、林素微(1998)。國小中低年級國語文成就測驗題庫建立之研究。測驗年刊,45(2),1-18。周台傑(1993)。國民小學國語文成就測驗編製報告。測驗年刊,40,77-90。
吳武典、張正芬(1984)。國語文能力測驗之編製及其相關研究。測驗年刊,31,37-52。林育柔(2001)。試題選項特徵曲線分析法-在「國小中年級面積概念」的應用。國立臺中師範學院教育測驗統計研究所碩士碩士論文。未出版。幸曼玲(1994)。外國人在台灣學習中文及使用中文之情境分析。第四屆華語文教學研討會論文集—教材教法組。台北:世界華語文教育學會。
吳裕益(1995)。國民中學國文科成就測驗常模與題庫建立之研究。台南師院測驗發展中心。
林麗雪(2002年11月20日)。九年一貫學生學習成就指標後年施測。聯合新聞網。
林寶貴、楊惠敏、許秀英(1995)。中華國語文能力測驗之編製及相關因素之研究。特殊教育研究學刊,12,1-24。
柯華葳、張郁雯(1999)。華語文能力測驗編製報告。測驗年刊,46(2),85~100。孫蓉華(2005年4月22日)。10年大計學生學習評量5月抽測萬人。聯合報,第八版。
國民中學學生基本學力測驗推動工作委員會(2005)。國民中學學生基本學力測驗製作流程與命題原則。線上檢索日期:2006年2月13日。網址:http://www.bctest.ntnu.edu.tw/
郭生玉(1990)。心理與教育研究法。台北市:精華書局。
教育部(1994)。國民中小學九年一貫課程綱要。
許秀英(民83)。青少年國語文能力測驗。台北市:教師研習中心。
陳秀玲(1999)。中部四縣市國小六年級學生第一性徵成熟狀況及性知識和性態度之調查研究。國立臺中師範學院國民教育研究所碩士論文。未出版。許天威、陳政見(1994)。國中新生國語文能力測驗。彰化市:彰化師範大學特殊教育系。
陳雯華(2003)。九年一貫社會領域基本學力測驗編製─以國小高年級為例。國立臺中師範學院教育測驗統計研究所碩士論文。未出版。葉德明(1994)。漢語詞彙研究。第四屆華語文教學研討會論文集—教材教法組。台北:世界華語文教育學會
楊明宗(2001)。數學試題分析模式的建制-以「九十學年度四技二專入學測驗」商業類「數學科」試題為例。國立臺中師範學院教育測驗統計研究所碩士論文。未出版。劉湘川(2000)。點二系列相關試題鑑別指數之值譜分析及其在IRT上之應用。測驗統計年刊,8,1-17。謝文全(2002)。美國教育改革動向與國內教育改革現狀之探討。教育研究月刊,97,5-12。
鐘榮富、林秀春(1994)。外籍學生中文口試及筆試的句法結構之研究。第四屆華語文教學研討會論文集—教材教法組。台北:世界華語文教育學會。
二、英文部分
Baker,F.B. (2001).The basics of item response theory. Portsmouth, N.H. : Heinemann.
Bashaw, W. L. (1982). Educational testing application of the Rasch Model. In C. Reynold (ed.). Handbook of School Psychology.
Bloom,B.S. (1956). Taxonomy of Educational Objeatives: Cognitive Domain.New York:David Mckay Co.,Inc.
Carmines,E.G. & Zeller,R.A.(1979). Reliability and validity assessment. Beverly Hills,CA:Sage.
Crocker, L.,& Algina, J. (1986). Introduction to classical and modern test theory. New York: Holt, Rinehart & Winston.
Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika, 16, 297-334.
Gronlund,N.E. (1993). How to make achievement tests and assessments (5th ed.)Boston:Allyn & Bacon.
Guilford, J. P. (1954). Psychometric methods. New York: McGraw-Hill.
Guion, R. M., & Ironson, G. H. (1983). Latent trait theory for organizational research. Organizational Behavior and Human Performance, 31, 54-87.
Gullikson, H. (1987). Theory of mental tests. Hillsdale, NJ: Lawrence Erlbaum Associates. (Originally published in 1950 by New York: John Wiley & Sons)
Guttman, L. (1944). A basis for scaling qualitative data. American Sociological Review, 9,139-150.
Haladyan,T.M. (1999). Developing and validating multiple-choice test items ed. Mahwah, NJ:Lawrence Erlbaum Associates.
Hambleton, R. K., & Cook, L. L. (1977). Latent trait models and their use in the analysis of educational test data. Journal of Educational Measurement, 14, 75-96.
Hambleton, R. K., & Swaminathan, H. (1985). Item response theory: Principles and applications. Boston: Kluwer.
Hambleton, R. K., Swaminathan, H., & Rogers, H. J. (1991). Fundamentals of item response theory. Newburry Park, CA: SAGE.
Hutten,L. (1980,April). Some empirical evidence for latent trait model selection. Paper presented at the annual meeting of the American Educational Research Association,Boston MA.
Lord,F.M.,& Novick,M.R.(1968). Statistical theories of mental test scores. Reading, MA: Addison-Wesley.
Lord, F. M. (1980). Applications of item response theory to practical testing problems. Hillsdale, NJ: Lawrence Erlbaum Associates.
Reckase, M. D. (1979). Unifactor latent trait models applied to multifactor tests results and implications. Journal of Educational Statistics, 4, 207-230.
Richardson, M. W. (1936). The relationship between difficulty and the differential validity of a test. Psychometrika, 1, 33-49.
Salvia, J., & Yesseldyke, J. E. (1991). Assessment. Boston: Houghton Mifflin Company.
Terman, L. M. (1916). The measurement of intelligence. Boston, MA: Houghton Mifflin.
Thurstone, L. L. (1929). Theory of attitude measurement. Psychological Bulletin, 36, 222-241.
Tucker, L. R. (1946). Maximum validity of a test with equivalent items. Psychometrika, 11, 1-13.
Yen,W.M. (1981). Using simulation results to choose a latent trait model. Applied Pschological Measurment, 5, 245-262.