 摘要 本研究主要在了解如何改進命題方式以提升測驗的品質，以「一0七學年度商業類數學科高三期中考試題」整份試題來作質與量的分析，研究對象為研究者所任教學校的全體商業類高三的學生，針對測驗資料並探討答題情形，資料處理使用的軟體為TestGraf98。綜合本研究的分析，歸納出以下結果：一、 由內容效度檢核表和雙向細目表顯示此份試題具有良好的內容效度。二、 由信度指數顯示此份試題具有不錯的信度。三、 在試題檢核表的檢核下，顯示此份試題大部分符合質的檢核項。四、 由試題難易度指數顯示此份試題屬於簡單的試題。五、 由試題鑑別度指數顯示此份試題是優良的試題。六、 由「正答選項特徵曲線」得知此份試題可區分高、低能力者對於高職數學概念的理解。七、 由「誘答選項特徵曲線」顯示此份試題大部分都具有良好的誘答選項。八、 從「正答選項特徵曲線」和「誘答選項特徵曲線」之分析後，顯示此份試題中的所有選項大部分都是屬於優良的選項。關鍵詞：試題反應理論、難度、鑑別度
 AbstractThis study is mainly to understand how to improve the proposition method to increase the quality of the exam. All the questions of 107th School Year Commerce Math Mid-term Exam are analyzed both qualitatively and quantitatively. The research subjects are the whole commercial grade-3 students in the researcher’s school. The reseacher uses the math questions to analyze the results of the students’ answers. The software used to do the analyses is TestGraf98. The results of the research are as follows:1. The content validity of this question is displayed by the content validity checklist and the two-way breakdown table.2. The reliability of this question is shown by the reliability index.3. It is displayed whether the test questions meet the quality check items under the check of the test checklist4. The difficulty level of the test questions is displayed by the difficulty of the test questions.5. The degree of discrimination of the test questions is indicated by the test identification degree indicator.6. From “the curve of positive answer option characteristic”, the differences can be distinguished between the high-ability and low-ability students’ understanding of vocational high school math.7. “The curve of tempting option answer characteristic” shows whether this question has a good luring option.8. From the analysis of “the curve of positive answer option characteristic” and “the curve of tempting option answer characteristic”, it shows whether all the options in this exam are good options.keywords：item response theory、difficulty、discrimination
 目次摘要...........................................................................................................IAbstract…………………………………………………….………….III目次……………………………………………………….………….....V表次……………………………………………………….…………..VII圖次………………………………………………….…….…………..IX第一章 緒論……………………………………………………………1 第一節 研究動機……………………………………………….….1 第二節 研究目的…………………………………………………..2 第三節 待答問題…………………………………………………..2 第四節 名詞解釋…………………………………………………..3第二章 文獻探討....................................................................................5 第一節 古典測驗理論......................................................................5 第二節 試題分析理論......................................................................9 第三節 測驗分析理論.......................................................13 第四節 選項特徵曲線.......................................................17第三章 研究方法..................................................................21 第一節 研究架構..............................................................22 第二節 研究對象..............................................................23 第三節 研究工具..............................................................23 第四節 研究流程..............................................................24第四章 結果與討論…………………………………….………..25 第一節 試題題本分析.......................................................25 第二節 個別試題分析.......................................................28 第三節 數學科期中考試題作答分析………………………….…43 第四節 研究結果討論…………………………………………69第五章 結論與建議………………………………………………71 第一節 結論......................................................................71 第二節 建議…………........................................................72參考文獻.................................................................................................74 壹、中文部分.....................................................................................74 貳、英文部分.....................................................................................80附錄..........................................................................................................82 附錄一 一○七學年度三年級數學科期中考試題卷........................82 附錄二 選項檢核表…………………………………………………85
 參考文獻壹、中文部分王文中、呂金燮、吳毓營、張郁雯、張淑慧（1999）。教育測驗與評量。台北市：五南。王麗娟(2004)。數學評量的願景與迷失。2010年4月30日，線上檢索日期：http://163.26.20.2/math/paper.htm。王寶墉（1995）。現代測驗理論。台北市：心理。余民寧（1991）。試題反應理論的介紹（一）－測驗理論的發展趨勢。研習資訊雙月刊，8，6，13-18。余民寧（1992a）。試題反應理論的介紹（二）－基本概念和假設。研習資訊雙月刊，9，1，5-9。余民寧（1992b）。試題反應理論的介紹（三）－試題反應模式及其特性。研習資訊雙月刊，9，2，6-10。余民寧（1992c）。試題反應理論與介紹（六）－能力量尺。研習資訊，9，5，8-12。余民寧（1997）。教育測驗與評量－成就測驗評量。台北市：心理。余民寧（2002）。教育測驗與評量－成就測驗與教學評量。台北市：心理。吳明隆（2003）。SPSS統計應用學習實務－問卷分析與應用統計。台北市：知城數位科技。吳慧珉（2001）。選項特徵曲線之研究－以核函數之平滑化為估計取向。台中師範學院教育測驗統計研究所碩士論文，未出版，台中市。吳裕益（2000）。教學評量的新趨勢。教育研究，70，6-9。李坤崇（2002a）。國民中小學成績評量準則之多元評量理念。載於教育部主編：國中小校長與督學培訓手冊（頁137-154）。台北市：教育部。李坤崇（2002b）。多元化教學評量理念與推動策略。教育研究月刊，91，24-36。李坤崇（2004）。綜合活動學習領域概論。台北市：心理。李坤崇（2006a）。教學目標、能力指標與評量。台北市：高等教育文化事業。李坤崇（2006b）。教學評量。台北市：心理。林天佑（1998）。基本學力。教育資料與研究，25，77-78。林育柔（2001）。試題選項特徵曲線分析法－在「國小中年級面積概念」的應用。台中師範學院/教育測驗統計研究所碩士論文，未出版，台中市。林敬修（2003）。淺談信度意涵與類推性理論。教育趨勢導報，焦點論壇，6，頁14。林重新（2001）。心理與教育測驗。台北市：揚志。邱麗綺（2003）。高年級國語科卷綜評量中的師生互動及學生自評與互評之研究。國立嘉義大學國民教育研究所論文，未出版，嘉義市。周文欽、歐滄和、許擇基、盧欽銘、金樹人、范德鑫（1995）。心理與教育測驗。台北市：心理。洪瑞鎂（2001）。從「第三次國際數學與科學教育成就研究後續調查」探究台灣國二學生的數學基本能力。國立臺灣師範大學數學研究所碩士論文，未出版。洪萬生（2008）。從國際教育評比淺論當前數學教育的得失。科學月刊，39，2，頁85。胡釗維、王茜穎（2009）。父母必修課--教出小達爾文的三學分。商業周刊，1108，頁109。洪碧霞（1999）。國小數學科教學評量的改革與創新。發表於迎向千禧年新世紀中小學課程改革與創新教學學術研討會，國立高雄師範大學。施建寧（2006）。國中基本學力測驗之實徵性研究。中學教育學報。柳玉清，邱美秀（1997）。教育測驗與評量。譯自Tom K. ＆ Gary B. : Educational testing and measurement: classroom application and practice. 5th ed. 臺北：五南。郭生玉（1999）。心理與教育測驗。台北市：精華。郭生玉（2003）。心理與教育測驗。台北市：精華。許天維（1994）。數學試題分析法－八十一學年度國民教育階段國小組數學科基本成就評量分析為例。高雄市：大漢唐。許韡瀚（2007）。國民小學學生數學能力診斷評量試題分析之研究。國立雲林科技大學技術及職業教育研究所碩士論文，未出版，雲林縣。陳柏熹（2006）。測驗萬花筒-IRT在測驗編制上的運用。飛揚通訊，42。國民中學學生基本學力測驗推動工作委員會(2005)。九十四年基測專欄—相關問題與回答。2010年5月8日，線上檢索日期：http://www.bctest.ntnu.edu.tw/。教育部(1996)。中小學基本學力指標之綜和規劃研究。台北市，教育部。教育部(2000)。技職教育白皮書。台北市，教育部。教育部(2003)。職校群科課綱。2010年3月16日，線上檢索日期：http://course.tvc.ntnu.edu.tw/。教育部（2003）。新聞稿。九十四年國中學生基本學力測驗參考題本說明。陳文典（2002）。「以學生為主」的教學評量。學校本位課程。陳英豪、吳裕益（2001）。測驗與評量。高雄市：復文。陳淑美（1989）。選擇題的編擬原則。諮商與輔導，43，29-33。國立編譯館主編（2000）。教育大辭書（五）。台北市：文景。國立台灣師範大學教育研究中心（1996）。中小學基本學力指標之綜合規劃研究。台北市：國立臺灣師範大學教育研究中心。張淑女（2008）。發展「真實性評量」來探討台灣中學生的科學素養。亞太科學教育論壇，9，1，文章15。張崇瑋（2007）。數學試題分析之研究－「以九十四學年度台灣區職業學校工業類聯合模擬數學試題為例」。國立高雄師範大學數學系碩士論文，未出版，高雄市。張添洲（2004）。X檔案-教學檔案、學習檔案。臺北市：五南。張經昆（2003）。人性化的評量—學習檔案。康軒教育雜誌，43期。黃美芳、陳雁芳、郭伯臣、許天維（2007）。數學領域能力指標測驗題庫之建置--以國小五年級為例。測驗統計年刊，15，頁63。黃國清（2004）。台南市九年一貫課程七年級數學領域成就測驗之編製與其相關之研究。國立中山大學教育研究所碩士論文，未出版，高雄市。曾希文（2007）。基測如採IRT可測程度。聯合報。2010年4月16日，線上檢索日期http://mag.udn.com/mag/campus/storypage.jsp?f_MAIN_ID=171&f_SUB_ID=123&f_ART_ID=99544。傅粹馨（2002）。信度、Alpha係數與相關議題之研究。教育學刊，18，163-184。楊少強（2009）。貧農之子如何屢敗屢戰「沒有林肯就沒有歐巴馬」。商業周刊，1108，頁86。楊志強（2004）。教師專業成長與實踐智慧。國立台北師範學院九十三年度地方教育輔導叢書，93-104。楊志強、楊志堅（2003）。選項特徵曲線在科學教育評量之應用。應用教學科技於科學教育學術研討會，國立嘉義大學。楊明宗（2002）。數學分析試題模式的建制—以九十學年度四技二專入學測驗 [商業類]數學科試題為例。國立台中師範學院教育測驗統計研究所理學碩士學位論文，未出版，台中市。楊思偉、李吟、張煌熙、張景媛、王大修、王叢桂等人（1999）。國民中小學九年一貫課程基本能力實踐策略。教育部委託專案研究報告，國立臺灣師範大學教育研究中心。詹志禹（1996）。評量改革為什麼要進行—回應吳毓瑩「評量的蛻變與突破」。發表於國立台北師範學院八十四學年度教育論壇，第6場。潘靖瑛（2006）。57分，應不應該PASS。教學新知電子通訊，20期。劉湘川（2001）。核平滑化試題選項特徵曲線與選項關連結構整合擴充模式。測驗統計年刊，9，1-18。劉美蓮（2001）。音樂簡譜不是毒蛇猛獸。自由時報，自由廣場。2010年3月24日，線上檢索日期：http://www.libertytimes.com.tw/2001/new/dec/29/today-o1.htm#o4鄭蕙如（2001）。九年一貫課程數學領域評鑑工具發展之研究。國立臺灣師範大學教育心理與輔導研究所碩士論文，未出版，台北市。劉湘川（2000）。點二系列相關試題鑑別指數之值譜分析及其在 IRT 上之應用。測驗統計年刊，8，1-20。劉湘川、許天維、鄭富森（1989）。IRT軟體估計精確度之比較。測驗統計年刊，6 1，1-112。歐滄和（2002）。教育測驗與評量。台北：心理。簡茂發（1992）。教學評量原理與方法。黃光雄主編：教學原理。台北市：師大書苑。簡茂發（1994）。教育心理學基礎。黃光雄主編：教育概論（四版），127-143。台北市：師大書苑。簡茂發（2002）。心理測驗與統計方法。台北市：心理。簡茂發、劉湘川、許天維、郭伯臣（1993）。試題反應理論在國民教育階段國小數學科基本學習成就評量上的應用。測驗年刊，41，1-17。劉靜宜（2003）。高中學生學習動機、學習策略、求助行為與學業成就之研究。國立彰化師範大學，彰化市。葉炳煙（2013）。學習動機定義與相關理論之研究。屏東教大體育，16，1-9。教育部（2015）。十二年國民基本教育課程綱要總綱。台北市：教育部。 貳、英文部分Bashaw, W. L. (1982). Educational testing application of the Rasch Model. In C. Renold(ed.). Handbook of School Psychology.Bloom, B. S., Englehart, M. D., Furst, E. J., Hill, W. H., & Krathwohl, D. R.(1956). Taxonomy of educational objectives: Handbook I, cognitive domain. New York: McKay.Carmines, E. G. & Zeller, R. A. (1979). Reliability and validity assessment. Beverly Hills, CA: Sage.Chase C. I. (1978). Measurement for educational evaluation. ( 2nd ed. ) Reading, MA: Addsion-Wesley.Crocker, L.,& Algina, J. (l986). Introduction to classical and modern test theory. New York: Holt, Rinehart &Winston.Ebel, R. L. & Frisbie, D. A. (1991). Essentials of educational measurement (5th ed. ) Ennlewood Cliffs, NJ: Prentice Hall.Guion, R. M., & Ironson, G. H.(1983). Latent trait theory for organizational research. Organizational Behavior and Human Performance, 31, 54-87.Gullikson, H. (1987). Theory of mental tests. Hillsdale, NJ: Lawrence Erlbaum Associates. (Originally published in 1950 by New York: John Wiley & Sons)Hambleton, R. K. (1989). Principles and selected applications of item response theory. In R. L. Linn (Ed.), Educational measurement (3rd ed., pp. 147-200). New York: Macmillan.Hambleton, R. K., & Cook, L.L.(l977). Latet trait medels and their use in the analysis of educational test data. Journal of educational measurement, l4, 75-96.Hambleton, R. K., & Swaminathan, H. (l985). Item response theory: Principles and applications. Boston: Kluwer.Hambleton, R. K., Swaminathan, H., & Rogers, H. J. (l99l). Fundamentals of item response theory. Newburry Park, CA: SAGE.Kevin R. Murphy & Charles O. Davidshofer(2005). Psychological testing: Principles and applications. (6th ed.). Upper Saddle River, N.J. :Pearson/Prentice Hall.Kibler, R. J., Cegala, D. J., Barker, L. L., & Miles, D. T. (1974). Objectives or instruction and evaluation. Boston: Allyn and Bacon.Lord, F. M. (1980). Applications of item response theory to practical testing problems. Hillsdale, NJ: Lawrence Erlbaum Associates.Lord, F. M., & Novick, M. R. (1968). Statistical theories of mental test scores. Reading,MA: Addison-Wesley.Norman E. Gronlund(2006). Assessment of student achievement. (8th ed).Peckase, M. D. (1979). Unifactor latent trait models applied to multi- factor test: Results and in placations. Journal of Educational Statistics, 4, 207- 230.Peter W. Airasuan(2005). Classroom assessment: Concepts and applications. (5th ed. ). Boston :McGraw-Hill.Ramsay, J. O. (1991). Kernel smoothing approaches to nonparametric item characteristic curve estimation. Psychometrika, 56, pp. 611-630.Ronald Jay Cohen & Mark E. Swerdlik(2002). Psychological testing and aassessment: An introduction to test and measurement.(5th ed.). Boston: McGraw-Hill.Wright, B. D. & Stone, M. H. (1979). Best test design: Rasch measurement. Chicago: MESA press. Wright, B. D.(1977). Solving measurement problems with the Rasch model. Journal of Educational Measurement, 14, 97-116.
