本站小編為你精心準(zhǔn)備了不同參數(shù)模型項目估計結(jié)果比較研究參考范文,愿這些范文能點燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。
《大連教育學(xué)院學(xué)報》2016年第3期
摘要:
參數(shù)估計是項目反應(yīng)理論應(yīng)用和發(fā)展的前提。本研究采用項目反應(yīng)理論,使用PARSCALE4.1軟件,選擇兩參數(shù)和三參數(shù)羅杰斯蒂混合模型對某年區(qū)域初中畢業(yè)生中考物理測驗成績進行項目參數(shù)估計,發(fā)現(xiàn)不同參數(shù)的項目參數(shù)估計結(jié)果在不同程度上存在差異。
關(guān)鍵詞:
項目參數(shù)估計;能力參數(shù)估計;羅杰斯蒂模型
教育測量是評價教育結(jié)果的重要方法,教育測量不僅包括對考試結(jié)果的評價分析,也包括對試題試卷質(zhì)量的評價分析。近年來,國內(nèi)開始采用經(jīng)典測量理論和項目反應(yīng)理論聯(lián)合使用,對測量數(shù)據(jù)進行精細(xì)分析。與經(jīng)典測量理論相比,項目反應(yīng)理論的優(yōu)勢在于,它可以計算出項目參數(shù)(試題難度、區(qū)分度),還可以預(yù)估出考生能力參數(shù);并且項目參數(shù)和能力參數(shù)彼此相互獨立,即考生能力參數(shù)的估計不受所選用試題的影響,試題難度和區(qū)分度的估計也不受考生樣本的影響,但項目參數(shù)的估值往往受到不同參數(shù)選擇個數(shù)的影響。研究人員以某年初中畢業(yè)生中考物理學(xué)科成績?yōu)槔謩e用二參數(shù)羅杰斯蒂混合模型和三參數(shù)羅杰斯蒂混合模型對項目參數(shù)和考生能力參數(shù)進行參數(shù)估計,進而比較兩種參數(shù)估計對項目難度和區(qū)分度結(jié)果的影響。大連市初中畢業(yè)生學(xué)業(yè)考試物理試卷承擔(dān)著畢業(yè)與選拔兩種功能。本研究選擇某一年大連市市內(nèi)五區(qū)考生中考物理考試成績,該試卷包括選擇題、填空題、計算題、簡答題和綜合題五種題型,共31道題目,試卷滿分值為90分。根據(jù)經(jīng)典測驗理論分析,測驗Alpha信度系數(shù)0.920,物理試卷信度達到非常理想的程度。
一、項目反應(yīng)理論常用的羅杰斯蒂模型
建立在潛在特質(zhì)理論基礎(chǔ)上的項目反應(yīng)理論,通過建立考生作答反應(yīng)與題目特征量及能力水平間關(guān)系的非線性模型,估計被試的能力水平和題目參數(shù),同時也定義了信息函數(shù)。從數(shù)學(xué)角度看,項目反應(yīng)理論用含有未知參數(shù)的數(shù)學(xué)模型表示被試答對項目的可能性,是建立在概率的基礎(chǔ)之上。通常把試題難度、區(qū)分度、猜測系數(shù)稱為項目參數(shù),把被試的潛在特質(zhì)稱為能力參數(shù)。常見的模型有多級計分模型、等級模型、稱名模型,通常采用的是二值計分的單參數(shù)、二參數(shù)和三參數(shù)Logistic模型。現(xiàn)以二值計分的三參數(shù)Logistic模型來說明項目反應(yīng)理論。項目反應(yīng)理論三參數(shù)的模型(3PLM)為:pi()θ=ci+1-ci1+exp-daiθ(-b)(i)其中,d=1.7為常數(shù),θ為被試能力值,a為項目的區(qū)分度,b為項目的難度,pi()θ表示能力為θ的被試答對區(qū)分度為a、難度為b、猜測度為c的項目的概率。當(dāng)c=0時為二參數(shù)模型,當(dāng)c=0且a=1時為單參數(shù)模式。題目參數(shù)估計結(jié)果,項目難度估值一般在-3至+3之間;項目區(qū)分度一般大于零,原則上估值越大越好;項目猜測度越小,項目質(zhì)量越好。根據(jù)項目參數(shù)估計的結(jié)果,就可以在此基礎(chǔ)上分析項目質(zhì)量及對題目進行篩選。項目難度是項目篩選的參考指標(biāo),但是難度值的高低并不是單個項目取舍的依據(jù)。分析者應(yīng)考慮作為所選測驗項目整體構(gòu)成的難度分布與測驗所要求的難度分布是否擬合,并以此作為取舍的原則。項目區(qū)分度和猜測度是單個項目取舍的依據(jù),項目區(qū)分度一般不小于0.50,否則就應(yīng)考慮刪除,項目猜測度最大一般不應(yīng)超過0.25。[1]
二、不同參數(shù)模型項目參數(shù)擬合結(jié)果的比較
研究中采用項目分析軟件PARSCALE4.1對不同考生的能力值和項目參數(shù)值進行估計,選用的是二參數(shù)混合模型(二參數(shù)Logistic模型和分步評分模型)和三參數(shù)混合模型(三參數(shù)Logistic模型和分步評分模型)。用邊際極大似然法估計項目的難度、區(qū)分度和猜測度;對能力估計時采用牛頓極大似然估計法估計和后驗期望估計。用PARSCALE4.1軟件和選取Logistic混合模型對項目參數(shù)進行估計時,-2loglikelihood值是擬合統(tǒng)計量,表示模型和數(shù)據(jù)的擬合程度。這是一個相對統(tǒng)計量,用于模型比較,值越小擬合越好。最終二參數(shù)擬合統(tǒng)計量為698930.776,三參數(shù)為720646.935,顯然是二參數(shù)模型與數(shù)據(jù)擬合的結(jié)果要比三參數(shù)的好。
1.單選題
中考物理選擇題分為單項選擇題和多項選擇題,猜測度的估計是針對單選題而言的。物理單選題的特點是在題目中給出四個選項,其中只有一個正確選項。分別用二參數(shù)和三參數(shù)模型對單選題進行項目參數(shù)估值,結(jié)果見表1所示。由表1可知,同一道題不同參數(shù)模型估計的難度、區(qū)分度均有差異。同一道試題二參數(shù)的難度估值小于三參數(shù)的難度估值,項目難度估值相差較大。例如,第3題二參數(shù)的難度估值是-2.236,三參數(shù)的難度估值為-0.916。除了第1題和第6題,其他試題區(qū)分度估值,二參數(shù)的均小于三參數(shù)的。再例如,第8題二參數(shù)區(qū)分度估值為0.877,三參數(shù)區(qū)分度估值為1.233。說明猜測度的估計對題目難度和區(qū)分度參數(shù)估計有較大影響。從猜測度估值角度看,c值小于0.25有兩個題目(第5、9題),c值為0的有兩道題(第1、6題),c值大于0.25的有五道試題(第2、3、4、7、8題)。試題猜測度小,說明考生在該試題上不容易猜對。
2.多項選擇題及主觀題
多項選擇題的特點是在題目給定的四個選項中選擇正確的選項,正確選項可能不止一個。如果考生選擇了錯誤選項,不給分;如果只選擇了部分正確選項,就給試題滿分的一半分;如果全選對了,就給滿分。對多項選擇題、主觀題分別用二參數(shù)混合模型與三參數(shù)混合模型進行項目參數(shù)估計,結(jié)果見表2所示。由表2可知,同一道題不同參數(shù)混合模型計算的難度估值有差異,二參數(shù)的難度估值小于三參數(shù)的難度估值,項目難度估值相差約為0.70,而試題區(qū)分度估值幾乎沒有差異,二參數(shù)與三參數(shù)相差不大于0.126。例如,第23題二參數(shù)的難度估值是-0.968,三參數(shù)的難度估值為-0.307;二參數(shù)區(qū)分度估值為0.502,三參數(shù)區(qū)分度估值為0.491。這說明對試題猜測度參數(shù)的估計,對試題難度估值有均衡影響,而對試題區(qū)分度幾乎沒有影響。由表2還可知,第10、11、12、31題的區(qū)分度在二參數(shù)和三參數(shù)混合模型的估值中均小于0.50,表明該試題對考生能力的區(qū)分功能不強。
三、思考與建議
1.中考物理項目參數(shù)擬合應(yīng)選擇二參數(shù)混合模型
從二參數(shù)模型與三參數(shù)模型的相關(guān)統(tǒng)計結(jié)果看,二參數(shù)與三參數(shù)難度值(b)的點二列相關(guān)系數(shù)為0.8662,區(qū)分度的點二列相關(guān)系數(shù)為0.7396。相對統(tǒng)計量的相關(guān)程度不高。建議在試題全部是客觀題時,選擇三參數(shù)的羅杰斯特混合模型為佳,否則要選擇二參數(shù)混合模型為好,以保證估計結(jié)果的準(zhǔn)確性。
2.中考物理命題應(yīng)以考查能力立意為主,更好地體現(xiàn)中考的選拔功能
從考生能力預(yù)估與原始得分的結(jié)果看,將原始得分與2PL模型能力參數(shù)估值進行相關(guān)分析,相關(guān)系數(shù)為0.9693,相關(guān)程度比較高,表明考生物理得分能很好地代表學(xué)生的物理學(xué)業(yè)能力。中考學(xué)科測試雖然是兼顧水平和選拔兩種測試功能,但中考物理考試基本上屬于能力測試,死記硬背不得分。
參考文獻:
[1]戴海琦.基于項目反應(yīng)理論的測驗編制方法研究[J].考試研究,2006(4):31-44.
作者:鄒麗華 單位:大連教育學(xué)院學(xué)習(xí)質(zhì)量監(jiān)測中心