研究生(外文):Ian-Iam Chan
論文名稱(外文):Multidimensional Computerized Adaptive Testing for Polytomous Items
指導教授(外文):Wen-Chung Wang
外文關鍵詞:standard errorbetween-item multidimensional testsroot mean square errordeterminant of the posterior informationmultidimensional item response theorythe generalized partial credit modelthe graded response modelpolytomous itemsmultidimensional computerized adaptive testing
當有多個測驗(能力測驗組合或多面向人格量表)要同時進行電腦化適性測驗(computerized adaptive testing; CAT)時,最簡單的作法就是逐一對分測驗或分量表進行CAT。但這種作法忽略了測驗間的關聯性,無法有效利用各測驗間的關聯性來提升測驗效率。本研究採用題間多向度電腦化適性測驗(multidimensionalcomputerized adaptive testing; MCAT),充分利用測驗間的關聯性,在顧及測驗信度下節省施測題數,提高測驗效率。
本研究先推導出適用於多分題的MCAT 之選題算則及能力估計方程式,再進行模擬實驗。實驗方式為使用自行推導出的二種多分題多向度試題反應模式(等級反應模式、一般部份計分模式),利用Frotran 90 編譯器編寫MCAT 程式,分別在三種分測驗數(2 向度、6 向度、12 向度)及三種向度間相關(r = 0.2、0.5、0.8)等不同情境中模擬10000 名考生進行MCAT。MCAT 流程以Segall(1996)的提出的最大事後分佈訊息量矩陣行列式法(maximum the determinant of the posterior information)作為選題標準,並計算其最大事後分佈(maximum a posterior)估計值。在測驗結束後再計算三種不同的能力估計方式(最大事後分佈、事後分佈期望值、最大概似值)的能力估計值,以及它們的平均開方誤(root mean square error)、誤差(bias)、測驗效率與能力估計測量標準誤(standard error),據此來檢驗在各種狀況下的能力估計準確性及測驗效率。
研究結果證明MCAT 能有效利用各向度間的關聯性來提昇效率。不管在等級反應模式還是一般部份計分模式,隨著向度間的相關程度越高、向度數目越多,MCAT 相對於UCAT(unidimensional computerized adaptive testing)的效率就越高,尤其是短測驗時更為明顯。在能力估計的準確性的檢驗,MCAT 在兩極端的能力值表現亦較UCAT 好。總而言之,MCAT 可以充分利用測驗間的關聯性,來提高測驗的效率。
The most common way to apply CAT to multiple tests (e.g., an ability test battery or multidimensional personality scales) is to adopt a CAT procedure separately oneach subtest or subscale. This unidimensional approach fails to take the correlations between subtests into consideration and therefore does not take this advantage to improve testing efficiency. In this research, I develop algorithms of multidimensional computerized adaptive testing (MCAT) for polytomous items in which the correlations between subtests are taken to reduce the numbers of administered items and to improve testing efficiency.
The thesis begins with derivation of item-selection rules and ability estimation equations for MCAT. Polytomous multidimensional item response models (i.e., the graded response model and the generalized partial credit model) are used to check the MCAT procedures under various conditions: Number of dimensions (2 , 6, and 12) and between-dimension correlations (r = 0.2, 0.5, and 0.8). Root mean square error and standard error measurement are used to assess the relative testing efficiency of MCAT over traditional UCAT (unidimensional CAT).
The results show that the higher the between-dimension correlation, the more the dimensions, the more efficient the MCAT over the UCAT would be, especially when tests are short. In sum, MCAT can utilize between-dimension correlation to improve testing efficiency.
第二節、多向度IRT 的重要性...........................................................................2
第一節、MIRT 回顧.............................................................................................9
第二節、MCAT 的能力估計.............................................................................10
第二節、MCAT 的選題.....................................................................................13
附錄A、GRM 的參數產生程式........................................................................50
附錄B、GRM 的MCAT 流程程式...................................................................58
附錄C、GPCM 的參數產生程式......................................................................73
附錄D、GPCM 的MCAT 流程程式................................................................77
附錄E、GRM 的一階導數推導........................................................................92
附錄F、GRM 的二階導數推導........................................................................92
附錄G、GRM 的訊息量矩陣計算公式推導....................................................93
附錄H、GPCM 的一階導數推導.....................................................................94
附錄I、GPCM 的二階導數推導.......................................................................95
附錄J、GPCM 的訊息量矩陣計算公式推導...................................................95
附錄K、EAP 的能力估計公式.........................................................................96

表1. 研究變項內容一覽表................................................................................19
表2. 試題參數限制設定一覽表..........................................................................20
表3. GRM 模式下之二向度平均向度的RMSE 表.................................23
表4. GRM 模式下之六向度平均向度的RMSE 表.................................24
表5. GRM 模式下之十二向度平均向度的RMSE 表.............................25
表6. GPCM 模式下之二向度平均向度的RMSE 表.............................34
表7. GPCM 模式下之六向度平均向度的RMSE 表.................................35
表8. GPCM 模式下之十二向度平均向度的RMSE 表.................................36

圖1. 二種類型的多向度測驗模式........................................................3
圖2. GRM 二向度之RMSE (MAP 估計法) .....................................................27
圖3. GRM 六向度之RMSE (MAP 估計法) .....................................................28
圖4. GRM 十二向度之RMSE (MAP 估計法) .....................................................29
圖5. GRM 六向度高相關的MAP 估計Bias(8 題/向度) ......................................30
圖6. GRM 六向度高相關的MAP 估計SE(17 題/向度) ......................................31
圖7. GPCM 二向度之RMSE (MAP 估計法) .....................................................38
圖8. GPCM 六向度之RMSE (MAP 估計法) .....................................................39
圖9. GPCM 十二向度之RMSE (MAP 估計法) .................................................40
圖10. GRM 六向度高相關的MAP 估計Bias(8 題/向度) ................................41
圖11. GPCM 六向度高相關的MAP 估計SE(17 題/向度) ..............................42
第一頁 上一頁 下一頁 最後一頁 top
