- 相關(guān)推薦
基于聯(lián)結(jié)主義的連續(xù)記分IRT模型的項目參數(shù)和被試能力估計
1 問題的提出與經(jīng)典測驗理論相比,項目反應(yīng)理論(簡稱IRT)由于具有參數(shù)不變性、能進行計算機化自適應(yīng)測驗等優(yōu)點而受到歡迎[1,2],但是也存在著不少問題,首先是目前比較成熟的、得到廣泛應(yīng)用的IRT軟件,如BILOG、MicroCAT等,主要是運用極大似然法或貝葉斯方法進行項目參數(shù)和被試能力估計[3],一般都只能處理二值記分的項目,也有少數(shù)軟件可以處理等級記分的項目,例如MULTILOG,但對于連續(xù)記分的項目還缺少估計方法和工具;其次是在運用BILOG、MicroCAT和MULTILOG等軟件時往往需要數(shù)百人的大樣本,而對于小樣本則缺少有效的估計方法,因此需要另尋途徑來解決這些問題。
2 聯(lián)結(jié)主義理論中的級連相關(guān)模型
聯(lián)結(jié)主義理論(或稱人工神經(jīng)網(wǎng)絡(luò))是近年來得到廣泛關(guān)注的認(rèn)知心理學(xué)理論[4,5,6],它一方面可以用來模擬人的認(rèn)知活動,探討人類的信息加工機制[7],另一方面可以作為一種工具來分析系統(tǒng)的輸入和輸出之間的關(guān)系,特別是當(dāng)系統(tǒng)的輸入和輸出之間難以用顯性的數(shù)學(xué)方程表示時,聯(lián)結(jié)主義模型就可以通過其本身的學(xué)習(xí)功能,在用一組已知的輸入和輸出數(shù)據(jù)對它進行訓(xùn)練以后,就可以在一定程度上掌握了該系統(tǒng)內(nèi)部的輸入和輸出之間的關(guān)系,即建立了某種模型。如果我們再給這個經(jīng)過訓(xùn)練的網(wǎng)絡(luò)模型以新的輸入,那么它就可以給出相應(yīng)的輸出值。因此,人們可以利用聯(lián)結(jié)主義模型的這種性質(zhì)來進行預(yù)測和參數(shù)估計等活動[8]。
聯(lián)結(jié)主義模型通常由一個輸入層、一個輸出層和若干個隱含層組成,每一層中含有若干個結(jié)點,一個模型中所含的隱含層數(shù)目和各層所含結(jié)點數(shù)目,是由具體問題的性質(zhì)和復(fù)雜程度來確定的。各個結(jié)點之間的聯(lián)結(jié)具有一定的權(quán)重,它的大小反映了相鄰兩個結(jié)點之間相互影響的程度,在模型被訓(xùn)練的過程中,各結(jié)點間的權(quán)重得到了調(diào)整。
聯(lián)結(jié)主義模型通?梢苑譃殪o態(tài)型和動態(tài)型兩種,靜態(tài)型模型的拓?fù)浣Y(jié)構(gòu)是實驗者在一開始的時候就設(shè)計好的,它的訓(xùn)練過程就是調(diào)節(jié)各結(jié)點之間的權(quán)重。動態(tài)型模型的拓?fù)浣Y(jié)構(gòu)是在訓(xùn)練過程中不斷變化的,它能夠隨著訓(xùn)練的進行,自動地加入新的隱含結(jié)點,同時也調(diào)整各結(jié)點間的聯(lián)結(jié)權(quán)重,這樣就可以更快地減少訓(xùn)練誤差。
級連相關(guān)模型是動態(tài)型聯(lián)結(jié)主義模型中的一種[9],它的計算精度較高,運算速度較快。在開始訓(xùn)練時,該模型只有輸入層和輸出層,處于最小拓?fù)浣Y(jié)構(gòu)。隨著訓(xùn)練過程的進行,它能夠根據(jù)需要自動地逐個加入隱含結(jié)點。該模型的訓(xùn)練分為輸出和輸入兩個階段交替進行,首先是輸出階段,在這一階段,模型對聯(lián)結(jié)隱含結(jié)點和輸出結(jié)點間的各權(quán)重進行調(diào)整,直到誤差不再減少為止;然后轉(zhuǎn)至輸入階段,在這一階段,模型對于聯(lián)結(jié)輸入結(jié)點和候選隱含結(jié)點間的各個權(quán)重進行調(diào)整,并從中選出其輸出變量和網(wǎng)絡(luò)的誤差變量間相關(guān)為最大的候選隱含結(jié)點,把它裝入網(wǎng)絡(luò),這樣使得每次裝入的新隱含結(jié)點都能最大程度地影響誤差的變化。然后再轉(zhuǎn)至輸出階段,這個過程不斷重復(fù),直到達到預(yù)定的訓(xùn)練精度。在本研究中,由于無法事先確定模型的拓?fù)浣Y(jié)構(gòu),以及為了較快地對模型進行訓(xùn)練和達到較好的訓(xùn)練和測試效果,采用了級連相關(guān)模型作為研究的工具。
3 連續(xù)記分IRT模型
連續(xù)記分IRT模型是二值記分IRT模型的擴展,即它的記分不是按照二值邏輯的全對或全錯的方式來進行,而是根據(jù)被試答對項目的程度來進行記分,如果全對該題目就得滿分。由于各題目的滿分值不一樣,有的是3分、5分、6分或更高的分?jǐn)?shù),為了統(tǒng)一起見,可以對它們進行歸一化處理,全部轉(zhuǎn)化為0至1的值。這樣就可以和下面的三參數(shù)邏輯斯諦模型中的P(θ)相一致。Samejima[10]、Muller[11]和Mullenbergh[12]等都對連續(xù)記分IRT模型進行過研究,它和二值記分模型一樣,可以用正態(tài)卵形模型和邏輯斯諦模型表示。對于常用的三參數(shù)邏輯斯諦模型,它的表示式為:
P(θ)=c[,i]+(1-c[,i])exp[1.7a[,i](θ-b[,i])]/{1+e
[1] [2] [3] [4] [5]
【基于聯(lián)結(jié)主義的連續(xù)記分IRT模型的項目參數(shù)和被試能力估計】相關(guān)文章:
基于聯(lián)結(jié)主義的連續(xù)記分IRT模型的項目參數(shù)和被試能力估計04-29
項目反應(yīng)理論多級記分模型參數(shù)估計的實現(xiàn)04-27
基于參數(shù)估計的層次診斷模型研究及應(yīng)用05-01
GPCM模型項目參數(shù)估計程序的開發(fā)與研究04-26
基于遺傳算法的非線性系統(tǒng)模型參數(shù)估計05-01
基于抗差估計的概率積分法的預(yù)計參數(shù)模型研究04-28
評聯(lián)結(jié)主義網(wǎng)絡(luò)模型對經(jīng)典皮亞杰任務(wù)的模擬04-27