第八章 人事測量的關(guān)鍵技術(shù):效度
測量的效度就是指測量的有效性,即能測量到所要測量的目標(biāo)的程度。效度的作用比信度更為重要。如果一個測驗效度很低,無論它的信度有多高,這項測驗都沒有應(yīng)用價值。
一、人事測量的有效性
1、效度的理論定義。從測量理論角度講,效度可以定義為:與測量目標(biāo)有關(guān)的真實分?jǐn)?shù)方差與總分方差的比率。
2、信度和效度的關(guān)系。信度和效度的差別在于所考慮的誤差不同。
(1)信度考慮的是隨機(jī)誤差的影響;效度的誤差則還包括對測驗?zāi)康膩碚f無關(guān)的變量所引起的系統(tǒng)誤差。
(2)信度高并不保證效度就一定高;但效度高的話,信度必然要高??梢赃@樣說,信度是效度的必要條件。
3、效度的性質(zhì)。實際上效度指的是“測量結(jié)果的效度”,是指測量結(jié)果的準(zhǔn)確性程度,而并不是指測驗本身。另外應(yīng)注意的一個問題是:效度是連續(xù)性的,效度高低只是程度上的差別,它不是“全有”或“全無”的變量。我們應(yīng)避免評價某一測驗的結(jié)果為“有效”或“無效”,而應(yīng)區(qū)分為效度較高或較低。
二、如何評估人事測量的效度
根據(jù)評估效度方法的不同,效度可以分為內(nèi)容效度、構(gòu)想效度和效標(biāo)關(guān)聯(lián)效度這三類。
(一)內(nèi)容效度
1、內(nèi)容效度是檢查測驗內(nèi)容是否是所欲測量的行為領(lǐng)域的代表性取樣的指標(biāo)。例如,成就測驗往往采用內(nèi)容效度的評估方法。
內(nèi)容效度分析時要注意兩方面的問題:
(1)應(yīng)避免將測驗取樣的行為領(lǐng)域過于泛化。
(2)要注意測驗分?jǐn)?shù)中無關(guān)因素的影響。
2、較好的內(nèi)容效試依賴于兩個條件:
(1)測驗內(nèi)容范圍明確;
(2)測驗洞察的取樣有代表性。
確定內(nèi)容效度的方法通常是由專家根據(jù)測驗題目和假設(shè)的內(nèi)容范圍作系統(tǒng)的比較判斷。
3、內(nèi)容效度的應(yīng)用。內(nèi)容效度最適合于評估教育和職業(yè)成就測驗。也適合于某些用于選拔和分類的人事測驗。
(二)效標(biāo)關(guān)聯(lián)效度
效標(biāo)關(guān)聯(lián)效度也稱效標(biāo)效度,反映的是測驗分?jǐn)?shù)與外在標(biāo)準(zhǔn)的相關(guān)程度,即測驗分?jǐn)?shù)對個體的效標(biāo)行為表現(xiàn)進(jìn)行預(yù)測的有效性程度。
1、預(yù)測效度和同時效度
(1)預(yù)測效度的效標(biāo)資料往往是測量結(jié)束后隔一段時間才獲得它反映的是由測驗分?jǐn)?shù)對任一段時間間隔后被試行為表現(xiàn)的預(yù)測程度。
(2)同時效度的效標(biāo)材料可以和測驗分?jǐn)?shù)差不多同時搜集。
(3)同時效度和預(yù)測效度的差異的根源不是收集效標(biāo)的時間,而是在于測驗?zāi)康牡氐牟煌?。前者多用于診斷現(xiàn)在的狀態(tài),后者多預(yù)測未來的結(jié)果。
2、效標(biāo)和效標(biāo)測量
(1)效標(biāo)是衡量測驗有效性的參照標(biāo)準(zhǔn),是一種可以直接、獨立測量的行為。
(2)要測量效標(biāo),就必須把效標(biāo)行為轉(zhuǎn)化為某種可以操作的測量指標(biāo),以便進(jìn)行了比較。這種可操作的測量指標(biāo)就稱為效標(biāo)測量。效標(biāo)的概念可以細(xì)分為觀念效標(biāo),(即效標(biāo)的實質(zhì)的概念內(nèi)容)和效標(biāo)測量(即效標(biāo)的具體度量方法。)。
(3)效標(biāo)污染是指由于評定者知道測驗分?jǐn)?shù)而影響個人的效標(biāo)成績的情形。
3、常用的效標(biāo)有以下幾種:
(1)學(xué)術(shù)成就。
(2)特殊訓(xùn)練成績
(3)實際工作表現(xiàn)
(4)團(tuán)體對照
(5)等級評定。評定可逡為任何測驗的效標(biāo),尤其適合人格測驗。
(6)先前有效的測驗。
(三)構(gòu)想效度
構(gòu)想效度是指測驗?zāi)軌驕y量到理論上的構(gòu)想或特質(zhì)的程度。
1、確定構(gòu)想效度的步驟。要確定一個測驗的構(gòu)想效度,包括三個基本步驟:
(1)建立理論框架,以解釋被試在測驗上的表現(xiàn);
(2)依據(jù)理論框架,推演出各種有關(guān)測驗成績的假設(shè);
(3)以邏輯和實證的方法來難假設(shè),根據(jù)這些累積材料決定這種理論是否能恰當(dāng)?shù)亟忉尙F(xiàn)有材料,如果不能作出恰當(dāng)解釋,則應(yīng)該修正上述假設(shè),直到能作了恰當(dāng)?shù)慕忉尀橹埂?/p>
2、常見的確定構(gòu)想效度的指標(biāo)
確定構(gòu)想效度的一般方法可以分為:
(1)測驗內(nèi)部的方法,如測驗內(nèi)容效度、內(nèi)部一致性等指標(biāo);
(2)測驗間的方法,如相容效度、因素分析、會聚效度和區(qū)分效度等指標(biāo);
(3)效標(biāo)效度的研究,如發(fā)展變化等指標(biāo);
(4)實驗和觀察方法,檢驗是否有構(gòu)想效度。
常用的指標(biāo)有:
(1)發(fā)展變化。
(2)與其他測驗的相關(guān)。
(3)因素分析。因素分析是分析行為資料內(nèi)部關(guān)系、結(jié)構(gòu)特性的一種統(tǒng)計技術(shù),比較適合于對構(gòu)想效度的研究。
(4)內(nèi)部一致性。
用來考驗內(nèi)部一致性的方法主要有三種:
1)考察總分?jǐn)?shù)較高和較低兩類人在各題目上通過率的大小。
2)計算題目與總分的相關(guān),如未達(dá)顯著水準(zhǔn),應(yīng)予以淘汰。
3)求分測驗與總分的相關(guān)。
(5)會聚效度和區(qū)分效度。
1)1960年坎貝爾指出,要確定一個測驗的構(gòu)想效度,則該測驗不僅應(yīng)與測量相同特質(zhì)或構(gòu)想等理論上有關(guān)的變量有高的相關(guān),也應(yīng)與測量不同特質(zhì)或構(gòu)想等理論上不同的變量有低的相關(guān),前者稱為會聚效度,后者和為區(qū)分效度。
三、影響效度的因素
影響效度的因素有很多,分別由測驗本身、樣本團(tuán)體、效標(biāo)、信度帶來的各種影響因素。
(一)測驗的因素。由測驗本身帶來的影響因素有:
1、測驗題目的質(zhì)量
2、實施測驗時的干擾因素
3、被試的影響因素
4、測驗的長度
(二)樣本團(tuán)體的性質(zhì)對測驗的效度產(chǎn)生影響體現(xiàn)在三個方面:
1、同一測驗對不同的團(tuán)體所測量的功能可能是不同的;
2、對于同一個測驗,效度團(tuán)體的性質(zhì)不同,效度也會有較大的差別
3、樣本團(tuán)體的異質(zhì)性對效度也會有影響
(三)效標(biāo)的性質(zhì)
1、如果其他條件相同,所測量的行為或心理特質(zhì)與效標(biāo)行為特質(zhì)越相似,效度系數(shù)就越高。
2、另外,效標(biāo)與測驗分?jǐn)?shù)之間的關(guān)系是否線性也是一個很重要的影響因素。