07年4月北大版“心理測(cè)量”串講資料(2)

  • 發(fā)布時(shí)間:2024-09-15 16:21:23
  • 來源:本站整理
  • 閱讀:
導(dǎo)讀:
  第二章 心理測(cè)驗(yàn)的編制
  第一節(jié) 心理測(cè)驗(yàn)的對(duì)象、目的及目標(biāo)
  1. 在編制測(cè)驗(yàn)前首先要明確測(cè)量的對(duì)象:也就是該測(cè)驗(yàn)編成后要用于哪些團(tuán)體。其包括三個(gè)重要的維度,即年齡、教育水平和文化背景。
  2. 測(cè)驗(yàn)的目的:一般來說;顯示和預(yù)測(cè)。由此我們可以分為兩類測(cè)驗(yàn):顯示性測(cè)驗(yàn)和預(yù)測(cè)性測(cè)驗(yàn)。(1)顯示性測(cè)驗(yàn):

第一節(jié) 心理測(cè)驗(yàn)的對(duì)象、目的及目標(biāo)

1. 在編制測(cè)驗(yàn)前首先要明確測(cè)量的對(duì)象:也就是該測(cè)驗(yàn)編成后要用于哪些團(tuán)體。其包括三個(gè)重要的維度,即年齡、教育水平和文化背景。

2. 測(cè)驗(yàn)的目的:一般來說;顯示和預(yù)測(cè)。由此我們可以分為兩類測(cè)驗(yàn):顯示性測(cè)驗(yàn)和預(yù)測(cè)性測(cè)驗(yàn)。(1)顯示性測(cè)驗(yàn):是指測(cè)驗(yàn)題目和所要測(cè)量的心理特征相似的測(cè)驗(yàn)。有些觀察法、行為評(píng)估法也都是顯示性測(cè)驗(yàn),題目取自一個(gè)很明確的總體的測(cè)驗(yàn)即是樣本測(cè)驗(yàn),題目取自一個(gè)全開發(fā)的總體的測(cè)驗(yàn)即是標(biāo)記測(cè)驗(yàn)。(2)預(yù)測(cè)性測(cè)驗(yàn):指預(yù)測(cè)一些沒被測(cè)量的行為的測(cè)驗(yàn)。

心理測(cè)驗(yàn)的目標(biāo)是指編制的測(cè)驗(yàn)是測(cè)什么的,即用來測(cè)量什么樣的心理變量或行為特征。(1)工作分析:對(duì)于選拔和預(yù)測(cè)功用的預(yù)測(cè)性測(cè)驗(yàn),主要任務(wù)是對(duì)所預(yù)測(cè)的行為活動(dòng)作具體分析,我們稱之為任務(wù)分析或工作分析。(2)對(duì)特定概念下定義:如果測(cè)驗(yàn)是為了測(cè)量某種特殊的心理品質(zhì)或特點(diǎn),那么測(cè)驗(yàn)編制者就必須給所要測(cè)量的心理或行為特質(zhì)下定義,然后必須發(fā)現(xiàn)該特質(zhì)所包含的維量將通過什么行為表現(xiàn)出來或怎樣進(jìn)行測(cè)量。(3)確定測(cè)驗(yàn)的具體內(nèi)容:如果測(cè)驗(yàn)是描述性的顯示測(cè)驗(yàn),它的目標(biāo)分析的主要任務(wù)則是確定顯示的內(nèi)容和技能,從中取樣。

第二節(jié) 測(cè)題的編寫技術(shù)

1. 搜集有關(guān)資料:題目的有關(guān)來源 (1)已出版的標(biāo)準(zhǔn)測(cè)驗(yàn)  (2)理論和專家的經(jīng)驗(yàn)(3)臨床觀察和記錄

2. 命題的原則及編寫要領(lǐng):1、命題的原則(理解):  ⑴內(nèi)容方面。首先,要求題目的內(nèi)容符合測(cè)驗(yàn)的目的;其次,內(nèi)容取樣要有代表性;第三,題目間內(nèi)容相互獨(dú)立,互不牽連。 ⑵文字方面。使用語言要準(zhǔn)確,語句要簡(jiǎn)明扼要,最好一句話說明一個(gè)概念,盡量少使用雙重否定句。⑶理解方面。題目應(yīng)有確切的答案,題目的內(nèi)容不要超出受測(cè)團(tuán)體的知識(shí)水平和理解能力,題目格式要容易理解。 ⑷社會(huì)敏感性方面。應(yīng)盡量避開社會(huì)敏感性問題,如涉及社會(huì)禁忌或個(gè)人隱私的題目不應(yīng)使用。

菲利普對(duì)于涉及社會(huì)敏感性問題,怎樣鼓勵(lì)被試作出真實(shí)回答的策略: ◇1命題時(shí)假定被試具有某種行為,、使他不得不在確實(shí)沒有該行為時(shí)才否定,可避免否定過多的傾向。◇2命題時(shí)假定規(guī)范不一致?!?指出該行為是常見的,雖然是違規(guī)的。2、測(cè)題的編制要求:對(duì)心理測(cè)驗(yàn)的題目進(jìn)行分類的標(biāo)準(zhǔn)很多,常見的分類是根據(jù)對(duì)被試的要求不同來分,可以分為兩大類:提供型選擇型題目。提供型題目要求被試給出正確答案,如論文題、簡(jiǎn)答題、填充題等;選擇型題目要求被試在有限的幾個(gè)答案中選擇正確的答案,如選擇題、是否題、匹配題等。選擇題我們比較熟悉,它由兩部分分構(gòu)成:提干和選擇。題干就是呈現(xiàn)一個(gè)問題的情景,一般由直接問句或不完全的陳述問或不完全的陳述句構(gòu)成。選項(xiàng)就是問題的多種可能答案,,常常是包括一個(gè)正確答案,若干(一般是1—5個(gè))錯(cuò)誤答案,其中錯(cuò)誤的答案叫“誘答”。

第三節(jié) 測(cè)驗(yàn)的編排和組織

一、測(cè)題的編排

1、測(cè)驗(yàn)編排的一般原則:⑴測(cè)題的難度排列易逐步上升。⑵盡可能將同類型的測(cè)題組合在一起。⑶各種類型測(cè)題本身的特點(diǎn)。

2.兩種常見的試題排列方式:(1)并列直進(jìn)式:整個(gè)測(cè)驗(yàn)按試題材料的性質(zhì)歸為若干分測(cè)驗(yàn),在同一分測(cè)驗(yàn)的試題依其難度由容易到難排列。(2) 混合螺旋式:先將各類試題依難度分成若干不同層次,再將不同性質(zhì)的試題加以組合,作交叉式排列,難度則漸次升進(jìn)。

第三章 測(cè)驗(yàn)的信度

第一節(jié) 信度的概念

1.信度是指同一被試在不同時(shí)間內(nèi)用同一測(cè)驗(yàn)(或用另一套相等的測(cè)驗(yàn))重復(fù)測(cè)量,所得結(jié)果的一致程度。信度只受隨機(jī)誤差的影響,隨機(jī)誤差越大,信度越低。

信度理論定義:傳統(tǒng)的信度理論認(rèn)為,每一個(gè)測(cè)驗(yàn)的實(shí)得分?jǐn)?shù)(X)總是由真實(shí)分?jǐn)?shù)(T)和誤差(E),兩個(gè)部份構(gòu)成的,公式為:

X=T+E

討論一組測(cè)驗(yàn)分?jǐn)?shù)的特性時(shí),可用方差導(dǎo)標(biāo)具體分?jǐn)?shù),公式:

(測(cè)驗(yàn)實(shí)得分?jǐn)?shù)的方差)= (測(cè)驗(yàn)真分?jǐn)?shù)的方差)+ (測(cè)驗(yàn)誤差的方差)

操作定義:一組測(cè)量分?jǐn)?shù)的真分?jǐn)?shù)方差與總方差(實(shí)得分?jǐn)?shù)的方差)的比率,或者是真實(shí)分?jǐn)?shù)方差占總方差的的百分比。計(jì)算公式:

由于真實(shí)分?jǐn)?shù)的方差是無法統(tǒng)計(jì)的,因此公式3-3可轉(zhuǎn)化為:

在(書上)圖3-1下面的話看一看。

2、信度的指標(biāo)

(1)信度系數(shù):大部分情況下,信度是信度系數(shù)為指標(biāo),它是一種相關(guān)系數(shù)。理論上說就是真分?jǐn)?shù)方差與實(shí)得分?jǐn)?shù)的方差的比值,公式是:

(2) 測(cè)量標(biāo)準(zhǔn)誤:信度系數(shù)表示一組測(cè)量的實(shí)得分?jǐn)?shù)與真分?jǐn)?shù)的符合程度,但并沒有直接支出個(gè)人測(cè)量分?jǐn)?shù)的變異量。

測(cè)量的標(biāo)準(zhǔn)誤與信度之間呈反比關(guān)系:標(biāo)準(zhǔn)誤越小,信度越;標(biāo)準(zhǔn)誤越大,信度越低。

3、信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋:(1)解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān):信度系數(shù)可以解釋為總的方差中有多少比例是由真實(shí)分?jǐn)?shù)的方差決定的,也就是測(cè)驗(yàn)的總變異中真分?jǐn)?shù)造成的變異占百分之幾。(2)比較信度可以接受的水平:一個(gè)測(cè)驗(yàn)究竟信度多高才適合,才讓人滿意呢?當(dāng)然,最理想的情況是 =1.00,但實(shí)際上辦不到。一般原則是:當(dāng) 0.70時(shí),測(cè)驗(yàn)不能用于對(duì)個(gè)人作出評(píng)價(jià)或預(yù)測(cè),而且不能作團(tuán)體比較;當(dāng)0.70≤ 0.85時(shí),可用于團(tuán)體比較;當(dāng) ≥0.85時(shí),才能用來鑒別或預(yù)測(cè)個(gè)人成績(jī)或作為。(3)解釋個(gè)人分?jǐn)?shù)的意義:從信度可以解釋個(gè)人分?jǐn)?shù)的意義,這是測(cè)量標(biāo)準(zhǔn)誤的應(yīng)用。它有兩個(gè)作用:一是估計(jì)真實(shí)分?jǐn)?shù)的范圍;二是了解實(shí)得分?jǐn)?shù)再測(cè)時(shí)可能的變化情形??磿?-8.(4)比較不同測(cè)驗(yàn)分?jǐn)?shù)的差異:測(cè)量標(biāo)準(zhǔn)誤和測(cè)驗(yàn)信度在評(píng)價(jià)兩個(gè)不同測(cè)驗(yàn)的分?jǐn)?shù)是否有明顯差異時(shí)也非常重要。這種比較包括兩個(gè)人不同分?jǐn)?shù)的差別和同一被試在兩個(gè)測(cè)驗(yàn)上的差別。

第二節(jié) 信度的類型及估計(jì)方法

1、 重測(cè)信度:又稱穩(wěn)定性系數(shù)。他的計(jì)算方法是采用重測(cè)法,即使用同一測(cè)驗(yàn),在同樣條件下對(duì)同一組被試前后施測(cè)兩次測(cè)驗(yàn),求兩次得分間的相關(guān)系數(shù)。

最適宜的時(shí)距隨測(cè)驗(yàn)的目的、性質(zhì)和被試的特點(diǎn)而異,一般是兩周到四周較宜,間隔時(shí)間最好不超過六個(gè)月。

重測(cè)信度的前提假設(shè)是:⑴所測(cè)量的特性必須是穩(wěn)定的;⑵每個(gè)人對(duì)前一次反應(yīng)的遺忘程度相同;⑶在時(shí)間間隔中沒有學(xué)習(xí)另外的與測(cè)驗(yàn)有關(guān)的東西。

2、 復(fù)本信度:又稱等值性系數(shù)。它是以兩個(gè)等值但題目不同的測(cè)驗(yàn)(復(fù)本)來測(cè)量同一群體,然后求得被試在兩個(gè)測(cè)驗(yàn)上得分的相關(guān)系數(shù),這個(gè)相關(guān)系數(shù)就代表了復(fù)本信度的高低。

復(fù)本信度的高低關(guān)鍵取決于復(fù)本測(cè)驗(yàn)的選擇,因而是題目取樣問題。

同重測(cè)信度一樣,復(fù)本信度也要考慮兩個(gè)復(fù)本實(shí)施時(shí)間間隔。如果兩個(gè)復(fù)本幾乎是在同一時(shí)間內(nèi)施測(cè)的,相關(guān)系數(shù)反映的才是不同復(fù)本的關(guān)系,而不摻有時(shí)間的影響。如果兩個(gè)復(fù)本的施測(cè)相隔一段時(shí)間,則稱穩(wěn)定與等值系數(shù)。穩(wěn)定與等值系數(shù)既考慮了測(cè)驗(yàn)在時(shí)間上的穩(wěn)定性,也考慮了不同題目樣本反應(yīng)的一致性,因而是更為嚴(yán)格的信度考察方法,也是應(yīng)用較為廣泛的方法。

內(nèi)部一致性信度包括:分半信度和同質(zhì)性信度。(1)分半信度:指采用分辦法估計(jì)所得的信度系數(shù)。這種方法估計(jì)信度系數(shù)只需一種測(cè)驗(yàn)形式,實(shí)施一次測(cè)驗(yàn)。通常是在測(cè)驗(yàn)實(shí)施后將測(cè)驗(yàn)按奇、偶數(shù)分為等值的兩半,并分別計(jì)算每位被試在兩半測(cè)驗(yàn)上的得分,求出這兩半分?jǐn)?shù)的相關(guān)系數(shù)?!?常見的是將測(cè)題按其序列號(hào)的奇偶分半,這種分法的前提是:測(cè)題并非隨機(jī)排列,而是按某種順序(如難度)排列;如果隨機(jī)排列的題目,則必須是所有題目平等的(要么難度相等,要么性質(zhì)一樣);如果測(cè)驗(yàn)有多個(gè)分量表,應(yīng)該在分量表內(nèi)部排好順序,再把各分量表分兩半組合起來求相關(guān)?!?常用的修正公式是:斯皮爾曼-布朗公式:

3、 斯皮爾曼-布朗公式為經(jīng)驗(yàn)公式,他的假設(shè)條件是兩半測(cè)驗(yàn)分?jǐn)?shù)的變異數(shù)相等,但實(shí)際資料有時(shí)未必完全符合這一條件。當(dāng)假設(shè)不成立時(shí),可采用:弗朗那根公式或盧倫公式中的任一一個(gè)。(公式見書3-12、3-13)

同質(zhì)性信度:指測(cè)驗(yàn)內(nèi)部所有題目間的一致性。當(dāng)各個(gè)測(cè)題的得分有較高的正相關(guān)時(shí),不論題目的內(nèi)容和形式如何,測(cè)驗(yàn)即為同質(zhì)的;若所有題目看起來好像測(cè)量的是同一特質(zhì),但相關(guān)很低或?yàn)樨?fù)相關(guān)時(shí),測(cè)驗(yàn)即為異質(zhì)的。此外,對(duì)于一些復(fù)雜的、異質(zhì)的心理學(xué)變量,采用單一的同質(zhì)性測(cè)驗(yàn)是不行的,因而常常采用若干相對(duì)異質(zhì)的分測(cè)驗(yàn),并使每個(gè)分測(cè)驗(yàn)內(nèi)容具有同質(zhì)性,這樣每個(gè)分測(cè)驗(yàn)就能用來預(yù)測(cè)異質(zhì)效標(biāo)的某一方面。同質(zhì)性信度的公式主要有:庫(kù)德-理查遜公式:常用的是K-R20公式,在個(gè)各測(cè)題難度相同或近似的情況

下,還可采用計(jì)算更為簡(jiǎn)便的K-R21公式。

克倫巴赫α系數(shù)(這幾個(gè)公式在書上好好看看)

4、 評(píng)分者信度:用于測(cè)量不同評(píng)分者之間所產(chǎn)生的誤差。為了衡量評(píng)分者之間的信度高低,可隨機(jī)抽取若干份測(cè)驗(yàn)卷,由兩位評(píng)分者按評(píng)分標(biāo)準(zhǔn)分別給分,然后再根據(jù)美分測(cè)驗(yàn)卷的兩個(gè)分?jǐn)?shù)計(jì)算相關(guān),即得評(píng)分者信度。一般要求在成對(duì)的受過訓(xùn)練的評(píng)分者之間平均一致性達(dá)0.90以上,才認(rèn)為評(píng)分是客觀的。

第三節(jié) 影響信度的因素

1、 樣本的特征:(1)樣本團(tuán)體分?jǐn)?shù)分布的影響:任何相關(guān)關(guān)系都是受到團(tuán)體中分?jǐn)?shù)分布的影響,當(dāng)分布范圍增大時(shí),其信度估計(jì)就較高;當(dāng)分布范圍減小時(shí),相關(guān)系數(shù)隨之下降,信度值則較低。(2)樣本團(tuán)體異質(zhì)性的影響:若獲得信度的取樣團(tuán)體較為異質(zhì)的話,往往會(huì)高估測(cè)驗(yàn)的信度,相反則會(huì)低估測(cè)驗(yàn)的信度。樣本團(tuán)體平均能力水平的影響:對(duì)于不同水平的團(tuán)體,題目具有不同的難度,每個(gè)題目在難度上的微小差異累計(jì)起來便會(huì)影響信度。

2、 測(cè)驗(yàn)的長(zhǎng)度:在一個(gè)測(cè)驗(yàn)中增加同質(zhì)的題目,可以使信度提高。①測(cè)驗(yàn)越長(zhǎng),測(cè)驗(yàn)的測(cè)題取樣或內(nèi)容取樣越有代表性;②測(cè)驗(yàn)越長(zhǎng),被試的猜測(cè)因素影響越小。

3、 測(cè)驗(yàn)的難度:如果一個(gè)測(cè)驗(yàn)對(duì)某團(tuán)體而言太容易,會(huì)使所得分?jǐn)?shù)都集中在高分端;當(dāng)題目太困難時(shí),得分就會(huì)集中在低分端。兩種情況均會(huì)使信度樣本的分?jǐn)?shù)范圍變窄,從而使測(cè)驗(yàn)變得不夠可靠。

4、 測(cè)驗(yàn)的時(shí)間間隔:以再測(cè)法或復(fù)本法求信度,兩次測(cè)驗(yàn)相隔時(shí)間越短,其信度系數(shù)越大;間隔時(shí)間越久,其它變因介入的可能性越大,受外界的影響越大,信度系數(shù)便越低。

第四章 測(cè)驗(yàn)的效度

第一節(jié) 效度的概念

1、 效度是指所測(cè)量的與所要測(cè)量的心理特點(diǎn)之間符合的程度,或者簡(jiǎn)單地說是指一個(gè)心理測(cè)驗(yàn)的準(zhǔn)確性。效度是科學(xué)測(cè)量工具最重要的必備條件。(1)一組測(cè)驗(yàn)分?jǐn)?shù)的總方差等于真實(shí)方差與誤差方差之和,而真實(shí)方差又可分為兩部分,即有關(guān)的方差和無關(guān)的但穩(wěn)定的方差,后者也就是所謂系統(tǒng)誤差帶來的方差 (公式4-2)。

2、 信度和效度的關(guān)系(1)信度是效度的必要而非充分條件:從方差分配公式: 可以看出, 增大,即效度高,信度的真方差( )必然大,故信度必然高。當(dāng)信度高時(shí),即 降低時(shí), 是否增加還要看 是否增減,因此效度不一定就高。效度高必然信度高,而信度高并不一定保證效度高,說明信度高只是效度高的必然條件,并不是效度高的充分條件。(2)效度是受信度制約的

3、 效度的性質(zhì):(1)a效度具有相對(duì)性:在評(píng)鑒測(cè)驗(yàn)的效度時(shí),必須考慮其目的與功能。只有所測(cè)的結(jié)果符合該測(cè)驗(yàn)的目,才能認(rèn)為它是個(gè)有效的測(cè)量工具。(2)效度具有連續(xù)性。測(cè)驗(yàn)效度通常用相關(guān)系數(shù)表示,它只有程度上的不同,而沒有“全有”或“全無”的區(qū)別。因此,我們?cè)u(píng)價(jià)一個(gè)測(cè)驗(yàn)時(shí),不應(yīng)該說“有效”或“無效”,而應(yīng)該用效度較高或效度較低來評(píng)價(jià)。

第二節(jié) 效度的類型與估計(jì)方法

一、效度的類型及評(píng)估方法

1、內(nèi)容效度:指的是測(cè)驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為取樣的適用性,從而確定測(cè)驗(yàn)是否是所欲測(cè)量的行為領(lǐng)域的代表性取樣。(名詞解釋)

(1)想編制有較高內(nèi)容效度的心理測(cè)驗(yàn):○1要對(duì)所測(cè)量的心理特性有個(gè)明確的概念,并劃定出哪些行為與這心理特性有關(guān),又比較密切?!?測(cè)驗(yàn)題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。

(2)需要說明的是,要求內(nèi)容效度的測(cè)驗(yàn),并不一定要求測(cè)驗(yàn)為同質(zhì)的。

2、內(nèi)容效度的評(píng)估方法:(1)專家判斷法:為了確定一個(gè)測(cè)驗(yàn)是否有內(nèi)容效度,最常用的方法是請(qǐng)有關(guān)專家對(duì)測(cè)驗(yàn)題目與原定內(nèi)容的符合性作出判斷,看測(cè)驗(yàn)的題目是否代表規(guī)定的內(nèi)容。如果專家認(rèn)為測(cè)驗(yàn)題目代表了所測(cè)內(nèi)容,測(cè)驗(yàn)就是有內(nèi)容效度。由于這種估計(jì)效度的方法,是一個(gè)邏輯分析的過程,所以內(nèi)容效度有時(shí)也可稱為“邏輯效度”。(2)統(tǒng)計(jì)分析法:計(jì)算兩個(gè)評(píng)分者之間評(píng)定的一致性,雖然考察的是評(píng)分者的判斷信度,但由于來自兩個(gè)獨(dú)立的評(píng)判者,因此符合程度越高越能反映測(cè)驗(yàn)的內(nèi)容效度??藗惏秃仗岢?,內(nèi)容效度可由一組被試在獨(dú)立取得自同樣內(nèi)容范圍的兩個(gè)測(cè)驗(yàn)復(fù)本上得分之相關(guān)來作數(shù)量的估計(jì)。再測(cè)法也可用于內(nèi)容效度的評(píng)估。(3)經(jīng)驗(yàn)推測(cè)法:通過實(shí)踐來檢驗(yàn)效度。如果通過率是隨著年齡的增加而增加,就可以推測(cè)該測(cè)驗(yàn)有內(nèi)容效度。

3、內(nèi)容效度與表面效度的關(guān)系:經(jīng)?;煜?。表面效度是由外行對(duì)測(cè)驗(yàn)作表面上的檢查確定的,它不反映測(cè)驗(yàn)實(shí)際測(cè)量的東西,只是指測(cè)驗(yàn)表面上看來好像是所要測(cè)的東西;內(nèi)容效度是由夠資格的判斷者(專家)詳盡地、系統(tǒng)地對(duì)測(cè)驗(yàn)作評(píng)價(jià)建立的。雖然二者都是根據(jù)測(cè)驗(yàn)內(nèi)容作出的主觀判斷,但判斷的標(biāo)準(zhǔn)不同。前者只考慮題目與測(cè)量目的之間的明顯的、直接的關(guān)系,后者則考慮到題目與測(cè)量目的和內(nèi)容總體之間邏輯的微妙關(guān)系。如果測(cè)驗(yàn)內(nèi)容看起來與測(cè)量目標(biāo)和要作的決定不相干,就會(huì)使被試產(chǎn)生不配合、馬馬馬乎乎、應(yīng)付了事等反應(yīng),而影響測(cè)驗(yàn)的效度。相反,典型行為測(cè)驗(yàn)卻要求較低的表面效度。如果被試很容易從測(cè)驗(yàn)題目看出測(cè)驗(yàn)的目的,就可能產(chǎn)生反應(yīng)偏差(如掩飾等)。

二、構(gòu)想效度

1、構(gòu)想效度:1954年提出,有人翻譯為構(gòu)思效度,也有叫結(jié)構(gòu)效度。它是指測(cè)驗(yàn)?zāi)軌驕y(cè)量到理論上的構(gòu)想和特質(zhì)的程度,即測(cè)驗(yàn)的結(jié)果是否能證實(shí)或解釋某一理論的假設(shè)、術(shù)語或構(gòu)想,解釋的程度如何。

2、構(gòu)想效度的估計(jì)方法:(1)對(duì)測(cè)驗(yàn)本身的分析:對(duì)測(cè)驗(yàn)本身的分析:測(cè)驗(yàn)的內(nèi)容效度可以作為構(gòu)思效度的證據(jù);測(cè)驗(yàn)的同質(zhì)性指標(biāo)可以推斷測(cè)驗(yàn)是測(cè)量單一特質(zhì)還是測(cè)量多種特質(zhì),從而為評(píng)估測(cè)驗(yàn)構(gòu)思效度提供證據(jù);分析被試對(duì)題目的反應(yīng)特點(diǎn)也可以作為構(gòu)思效度的證據(jù)。(2)測(cè)驗(yàn)間的相互比較:相容效度是構(gòu)思效度的一個(gè)證據(jù)。區(qū)分效度是構(gòu)思效度的又一個(gè)證據(jù),一個(gè)有效的測(cè)驗(yàn)不僅應(yīng)與其他測(cè)量同一構(gòu)思的測(cè)驗(yàn)有關(guān),而且還必須與測(cè)量不同構(gòu)思的測(cè)驗(yàn)無相關(guān);因素分析法也是建立構(gòu)思效度的常用方法,通過對(duì)一組測(cè)驗(yàn)進(jìn)行因素分析,可以找到影響測(cè)驗(yàn)分?jǐn)?shù)的共同因素,這種因素可能就是我們要測(cè)量的心理特質(zhì)(構(gòu)思)。(3)效標(biāo)效度的研究證明:一個(gè)測(cè)驗(yàn)若效標(biāo)度理想,那么該測(cè)驗(yàn)所預(yù)測(cè)的效標(biāo)的性質(zhì)和種類就可以作為分析測(cè)驗(yàn)構(gòu)思效度的指標(biāo),另一種證實(shí)構(gòu)思效度的方法是心理特質(zhì)的發(fā)展變化。實(shí)驗(yàn)法和觀察法證實(shí):觀察實(shí)驗(yàn)前和實(shí)驗(yàn)后分?jǐn)?shù)的差異是驗(yàn)證構(gòu)思效度的方法。

三、效標(biāo)效度

1、效標(biāo)效度:又稱實(shí)證效度,反映的是測(cè)驗(yàn)預(yù)測(cè)個(gè)體在某種情境下行為表現(xiàn)的有效性程度。被預(yù)測(cè)的行為是檢驗(yàn)效度的標(biāo)準(zhǔn),簡(jiǎn)稱效標(biāo)。由于這種效度是看測(cè)驗(yàn)對(duì)效標(biāo)預(yù)測(cè)如何,所以叫效標(biāo)效度。這種效度需在實(shí)踐中檢驗(yàn),所以又稱為實(shí)證效標(biāo)。

分類:根據(jù)效標(biāo)資料是否與測(cè)驗(yàn)分?jǐn)?shù)同時(shí)獲得,又可分為同時(shí)效度和預(yù)測(cè)效度兩類。同時(shí)效度即測(cè)驗(yàn)所得分?jǐn)?shù)可與效標(biāo)同時(shí)驗(yàn)證,通常與心理特征的評(píng)估及診斷有關(guān)。預(yù)測(cè)效度的效標(biāo)資料需要一段時(shí)間才可搜集到,通常用于選拔、分組。因?yàn)樾?biāo)資料在考試以后相隔一段時(shí)間才能獲得,所以高考的效標(biāo)是一種預(yù)測(cè)效標(biāo)。同時(shí)效標(biāo)和預(yù)測(cè)效標(biāo)意義上的差異,不是來源于時(shí)間,而是來自測(cè)驗(yàn)的目的。前者與用來診斷現(xiàn)狀的測(cè)驗(yàn)有關(guān),后者與預(yù)測(cè)將來結(jié)果的測(cè)驗(yàn)有關(guān)。

一個(gè)好的效標(biāo)必須具備以下條件:

○1必須能最有效地反映測(cè)驗(yàn)的目標(biāo),即效標(biāo)測(cè)量本身必須有效;

○2效標(biāo)必須具有較高的信度,穩(wěn)定可靠,不隨時(shí)間等因素變化;

○3效標(biāo)可以客觀地加以測(cè)量,可用數(shù)據(jù)或等級(jí)來表示;

○4效標(biāo)的測(cè)量的方法很簡(jiǎn)單,省時(shí)省力,經(jīng)濟(jì)實(shí)用。

2、效標(biāo)和效標(biāo)測(cè)量:效標(biāo),即衡量測(cè)驗(yàn)有效性的參照標(biāo)準(zhǔn),指的是可以直接而且獨(dú)立測(cè)量的我們感興趣的行為。我們感興趣的行為,就是要預(yù)測(cè)的行為,這是一個(gè)總的觀念,故必須以可操作的測(cè)量來確定才有實(shí)際意義。因此有必要把效標(biāo)細(xì)分為兩個(gè)層次,其一是理論水平的“觀念效標(biāo)”, 其二是操作定義水平的“效標(biāo)測(cè)量”。

3、常用的效標(biāo)包括:○1學(xué)業(yè)成就:如在校成績(jī)、學(xué)歷、有關(guān)的獎(jiǎng)勵(lì)和榮譽(yù)、教師對(duì)學(xué)生智力的評(píng)定等,常作為智力測(cè)驗(yàn)的效標(biāo),也可作為某些多重能力傾向測(cè)驗(yàn)和人格測(cè)驗(yàn)的效標(biāo)?!?實(shí)際工作表現(xiàn):是最滿意的效標(biāo)測(cè)量,為一般智力測(cè)驗(yàn)、人格測(cè)驗(yàn)和一些能力傾向測(cè)驗(yàn)的效標(biāo);○3特殊訓(xùn)練成績(jī)○4精神病診斷;○5等級(jí)評(píng)定:是觀察者根據(jù)測(cè)驗(yàn)欲測(cè)量的心理特質(zhì)在被試身上的表現(xiàn)而作出的一種個(gè)人判斷;○6效標(biāo)團(tuán)體的比較:即找出兩個(gè)在效標(biāo)表現(xiàn)上有差別的團(tuán)體,比較他們?cè)跍y(cè)驗(yàn)分?jǐn)?shù)上的差別;○7先前有效的測(cè)驗(yàn):一個(gè)新測(cè)驗(yàn)與先前有效的測(cè)驗(yàn)的相關(guān)也經(jīng)常作為效度檢驗(yàn)的證據(jù)。(簡(jiǎn)答)

相關(guān)閱讀

熱門標(biāo)簽

關(guān)于07年4月北大版“心理測(cè)量”串講資料(2)文章

2021年自學(xué)考試報(bào)考入口 2021年自學(xué)考試報(bào)考入口

熱門文章