4.匹配題。匹配題可以說是選擇題的一種變式。匹配題一般包括多個(gè)反應(yīng)項(xiàng)和多個(gè)刺激項(xiàng),用反應(yīng)項(xiàng)來匹配刺激項(xiàng)。匹配題有完全匹配和不完全匹配兩種形式。
優(yōu)點(diǎn):匹配題容易編制,而且可以在短時(shí)間內(nèi)測(cè)量大量相關(guān)聯(lián)的材料,覆蓋面較廣。缺點(diǎn):它一般只能測(cè)量簡(jiǎn)單記憶的事實(shí)材料或概念關(guān)系,并且要求編制的選項(xiàng)必須是同質(zhì)的。
☆◆對(duì)編制匹配題的一些建議:①刺激項(xiàng)目和反應(yīng)項(xiàng)目應(yīng)該分成兩列,通常反應(yīng)項(xiàng)安排在右邊;②配對(duì)數(shù)目不可過多或過少,最好使用不完全匹配,使反應(yīng)項(xiàng)數(shù)目多于刺激項(xiàng)數(shù)目,并且最好不限制每個(gè)反應(yīng)項(xiàng)被選擇的次數(shù),這樣可以降低猜測(cè)的概率;③匹配題的反應(yīng)項(xiàng)與刺激項(xiàng),其性質(zhì)必須相近;④應(yīng)對(duì)匹配方法、匹配的依據(jù)加以明確的規(guī)定和說明,同時(shí)說明反應(yīng)項(xiàng)可以被選擇的次數(shù);⑤同一組的反應(yīng)項(xiàng)與刺激項(xiàng)最好印在同一頁紙上,以免造成答題時(shí)間的浪費(fèi);⑥反應(yīng)項(xiàng)與刺激項(xiàng)應(yīng)以不同形式的序號(hào)加以標(biāo)識(shí),以免混淆。
5.填充題。☆◆編制填充題時(shí)應(yīng)注意:①最好采用問句形式;②使用直接問句的形式,可避免產(chǎn)生對(duì)題意的誤解;③如果是填空形式,填充處不可太多。過多空白會(huì)使題意不明確;④每題最好只有一個(gè)答案,答案最好簡(jiǎn)短而具體,有利于評(píng)分。
6.操作性測(cè)量形式。在很多情況下,操作的方法和過程是重要的測(cè)量目標(biāo),而這是紙筆測(cè)驗(yàn)無法測(cè)量的,這時(shí)可以采用操作性測(cè)量形式◎。操作性測(cè)試題通常分為著重過程和著重結(jié)果兩種形式。
操作性測(cè)試有多種不同的分類方法,按測(cè)試情境的真實(shí)性程度可分:①紙筆的操作性測(cè)試:雖用紙筆但偏重于模擬情境下知識(shí)的應(yīng)用,如編制某項(xiàng)操作計(jì)劃、步驟、注意事項(xiàng)等,如公文筐測(cè)驗(yàn);②模擬操作測(cè)試:強(qiáng)調(diào)正確的程序,被試需要在模擬情境下完成與真實(shí)活動(dòng)相同的動(dòng)作,如駕駛員的考核等;③工作樣本操作測(cè)試:其真實(shí)性最高,但是是在有控制的條件下去完成的。如司機(jī)在標(biāo)準(zhǔn)場(chǎng)地內(nèi)的考核。
設(shè)計(jì)操作性測(cè)試題的主要原則有:①明確所要測(cè)量的目標(biāo),并將其操作化。即要進(jìn)行工作分析,辯認(rèn)出操作中最重要的因素,找出具有代表性的工作樣本。②要建立作業(yè)標(biāo)準(zhǔn),規(guī)定通過此項(xiàng)作業(yè)的最低標(biāo)準(zhǔn)。③選擇合適的真實(shí)性程度。通常情況下,真實(shí)性程度越高,模擬的代價(jià)越大。④指示語簡(jiǎn)單明確,讓被試知道要干什么和在什么條件下去做。⑤有明確的計(jì)分方法。
◎作品量表:一般包括一系列按順序排列的不同作業(yè)程度、水平、質(zhì)量的標(biāo)準(zhǔn)樣本,評(píng)分時(shí)參照這些標(biāo)準(zhǔn)樣本對(duì)被試結(jié)果進(jìn)行評(píng)分。
7.面試。缺點(diǎn):①面試的考核缺乏心理測(cè)量學(xué)的嚴(yán)格性,易受考官的個(gè)人偏見或歧視的影響;②由于面試既要看應(yīng)試者對(duì)問題回答的內(nèi)容、質(zhì)量,還要看整個(gè)面試過程中的行為表現(xiàn),如情緒緊張度、應(yīng)變能力等,更加大了面試記分的難度。面試效果的好壞往往取決于面試考官。面試應(yīng)注意:①面試考官必須對(duì)面試主題有充分的了解,對(duì)于所要求的反應(yīng)有清晰的認(rèn)識(shí);②用于描述或評(píng)定被試反應(yīng)的詞語,必須具體化,避免模糊不清的陳述。
第三節(jié)題目的編排
◇題目選擇和編排過程包括定性的邏輯分析和根據(jù)預(yù)測(cè)的結(jié)果進(jìn)行的定量分析。
一、題目的選擇
1.◇對(duì)題目進(jìn)行初步選擇的主要依據(jù)是:題目本身的性質(zhì)、對(duì)預(yù)期測(cè)量目標(biāo)的可測(cè)量程度。
2.☆題目選擇的步驟包括:⑴檢查題目是否符合細(xì)目表中某一單元格內(nèi)的要求。⑵根據(jù)細(xì)目表對(duì)各部分所要求的比例選擇適當(dāng)數(shù)量的測(cè)試題,使測(cè)量工具盡量覆蓋整個(gè)細(xì)目表的內(nèi)容。⑶檢查題目是否敘述明確清楚,是否提供了額外線索。⑷檢查題目十分適合將要施測(cè)的對(duì)象和施測(cè)的條件。⑸檢查題目的難度是否恰當(dāng)。一般來說,難度為0.50較為合適。⑹檢查所選擇的題目是否彼此獨(dú)立,沒有重疊,即回答某一問題所需的知識(shí)與能否回答其他問題無關(guān)。
二、題目的編排
◇題目編排的原則包括:⑴將測(cè)量相同因素的測(cè)試題排列在一起。⑵盡可能地將同一類型的測(cè)試題組合在一起。⑶難度測(cè)驗(yàn)的題目應(yīng)按由易到難排列。這樣可以鼓舞被試的士氣,避免某些被試一開始就因較多題目回答不出而失去信心。⑷對(duì)于人格測(cè)驗(yàn),應(yīng)盡量避免將測(cè)量同一特質(zhì)的題目編排在一起,防止被試猜測(cè)出題目所要測(cè)查的因素。
三、測(cè)試題的預(yù)測(cè)試和分析
◎預(yù)備測(cè)試題:測(cè)試題編排完成并不意味著這項(xiàng)測(cè)量工具的編制就此完成。前面對(duì)題目的選取只是依靠編寫者的主觀經(jīng)驗(yàn),題目的效果如何還需要進(jìn)行定量的客觀分析。這時(shí)的測(cè)試題還只能叫做預(yù)備測(cè)試題,還需要獲取被試對(duì)這些題目的反應(yīng)的材料,為進(jìn)一步篩選題目和為編排測(cè)量工具提供客觀依據(jù)。
◎預(yù)測(cè)試:必須將預(yù)備測(cè)試題對(duì)一定規(guī)模的小樣本被試進(jìn)行施測(cè),獲得數(shù)據(jù)以進(jìn)行校驗(yàn)、修訂。這一過程稱為測(cè)試題的預(yù)測(cè)試。
◎題目分析:測(cè)驗(yàn)數(shù)據(jù)收集上來之后,應(yīng)該利用這些數(shù)據(jù)對(duì)題目進(jìn)行分析,刪除不好的題目或?qū)︻}目進(jìn)行修改,這個(gè)過程稱為題目分析。具體內(nèi)容包括對(duì)題目的項(xiàng)目分析和對(duì)測(cè)驗(yàn)信度、效度指標(biāo)的檢查。
對(duì)測(cè)試題的預(yù)測(cè)試應(yīng)注意以下問題:⑴預(yù)測(cè)試對(duì)象必須和將來正式測(cè)試的對(duì)象相似;⑵預(yù)測(cè)試的實(shí)施過程與情境應(yīng)力求與將來正式測(cè)量工具實(shí)施時(shí)的情境相似;⑶預(yù)測(cè)試的時(shí)限可稍寬些,最好使每個(gè)被試都能將題目答完,以便搜集充分的反應(yīng)資料,使統(tǒng)計(jì)分析的結(jié)果更為可靠;⑷在預(yù)測(cè)試過程中,應(yīng)將被試的各種反映情況隨時(shí)加以記錄。如,記錄在不同時(shí)限內(nèi)一般被試所完成的題目數(shù)、題意不清之處、被試的態(tài)度等,以便在在修改測(cè)驗(yàn)時(shí)作為參考。
預(yù)測(cè)試完成后,可以根據(jù)預(yù)測(cè)結(jié)果進(jìn)行題目分析,對(duì)每個(gè)題目的具體分析稱為項(xiàng)目分析,主要是指根據(jù)題目的難度、區(qū)分度、備選答案的合適度等數(shù)量指標(biāo)來對(duì)題目進(jìn)行分析。
第五章人事測(cè)量的實(shí)施與計(jì)分
第一節(jié)實(shí)施測(cè)量操作的要領(lǐng)與誤差控制
人事測(cè)量實(shí)施的最基本要求是,使所有的應(yīng)試者都在相同的條件下表現(xiàn)出自己的真正行為。
一、測(cè)量的操作程序
1.標(biāo)準(zhǔn)化指示語。在施測(cè)過程中應(yīng)該使用統(tǒng)一的指示語?!蛑甘菊Z是在測(cè)量實(shí)施時(shí)說明測(cè)量進(jìn)行方式以及如何回答問題的指導(dǎo)性語言。指示語通常有兩種:一種是對(duì)被試的,另一種是給主試的。前者應(yīng)該力求清晰和簡(jiǎn)單,向被試說明應(yīng)該做什么,即如何對(duì)題目作出反應(yīng)。
2.測(cè)驗(yàn)時(shí)限。大多數(shù)典型作為測(cè)驗(yàn)是不受時(shí)間限制的,如人格測(cè)驗(yàn)。大多數(shù)測(cè)驗(yàn)既要考慮反應(yīng)得速度,也要考察解決有較大難度題目的能力,在能力和成就測(cè)驗(yàn)中所使用的時(shí)限,以大約90%的被試能在規(guī)定時(shí)間內(nèi)完成測(cè)驗(yàn)為標(biāo)準(zhǔn)。
3.測(cè)驗(yàn)的環(huán)境條件。
二、主試的職責(zé)
1.◎主試:也稱考官或主考人,是控制測(cè)試進(jìn)程的主要人員。主試的經(jīng)驗(yàn)如何往往會(huì)對(duì)測(cè)驗(yàn)的結(jié)果產(chǎn)生影響。
◇☆主試應(yīng)做以下工作:⑴測(cè)驗(yàn)前的準(zhǔn)備工作。①預(yù)告測(cè)驗(yàn);②熟悉測(cè)驗(yàn)指示語;③準(zhǔn)備測(cè)驗(yàn)材料;④熟悉測(cè)驗(yàn)的具體程序;⑤確保
滿意合適的測(cè)驗(yàn)環(huán)境。⑵測(cè)驗(yàn)中主試的職責(zé)。測(cè)驗(yàn)中主試的職責(zé)是按照指示語的要求實(shí)施測(cè)驗(yàn),在被試詢問指示語意義時(shí),作進(jìn)一步澄清,但注意不要作任何暗示。在測(cè)驗(yàn)時(shí),主試還要注意不要講與測(cè)驗(yàn)無關(guān)的話,并能夠?qū)y(cè)驗(yàn)中的特殊情況作出靈活的解決。⑶建立協(xié)調(diào)關(guān)系。協(xié)調(diào)關(guān)系指的是主試和被試之間一種友好的、合作的、能促使被試最大限度地做好測(cè)驗(yàn)的一種關(guān)系。建立協(xié)調(diào)關(guān)系就是要求促使被試盡可能地對(duì)測(cè)驗(yàn)感興趣,遵從指示語,認(rèn)真合作地進(jìn)行應(yīng)試。主試都應(yīng)該采取熱情、友好并且客觀的態(tài)度,這是建立協(xié)調(diào)關(guān)系的前提。
三、測(cè)量實(shí)施過程中可能導(dǎo)致誤差的各種影響因素:
1.主試對(duì)測(cè)量結(jié)果的影響?!顪y(cè)量結(jié)果往往會(huì)受到主試的各方面因素的影響:⑴主試的人格特點(diǎn)。主試的不同特點(diǎn)對(duì)測(cè)驗(yàn)的實(shí)施及測(cè)驗(yàn)的評(píng)分等各環(huán)節(jié)都有影響。⑵主試的期望。羅森塔爾效應(yīng):在有些情況下,實(shí)驗(yàn)者所獲得的資料及實(shí)驗(yàn)結(jié)果會(huì)受其本身期望的影響,這種現(xiàn)象稱為羅森塔爾效應(yīng),又稱做實(shí)驗(yàn)者期望誤差。
2.☆被試特點(diǎn)對(duì)測(cè)量結(jié)果的影響:⑴測(cè)驗(yàn)的技巧與練習(xí)因素?!蚓毩?xí)效應(yīng):有不少研究發(fā)現(xiàn),應(yīng)試者參加相同或重復(fù)的測(cè)驗(yàn),會(huì)由于練習(xí)效應(yīng)而使測(cè)驗(yàn)成績(jī)提高。⑵焦慮和動(dòng)機(jī)因素。①應(yīng)試動(dòng)機(jī);②測(cè)驗(yàn)焦慮?!蚪箲]是一種不愉快的、表現(xiàn)為焦急、恐懼和緊張的情緒體驗(yàn),它主要是由于對(duì)可能出現(xiàn)的結(jié)果的擔(dān)心或?qū)?yīng)付這一結(jié)果的能力的擔(dān)心而造成。大多數(shù)人都在測(cè)驗(yàn)前和測(cè)驗(yàn)中感到焦慮,故又稱測(cè)驗(yàn)焦慮或考試焦慮。⑶反應(yīng)定勢(shì)?!蚍磻?yīng)定勢(shì)也成為反應(yīng)的方式或反應(yīng)風(fēng)格,簡(jiǎn)單地說,就是每個(gè)人回答問題的習(xí)慣方式?!钣绊憸y(cè)量結(jié)果的反應(yīng)定勢(shì)主要有以下幾種:①求“快”與求“精確”的反應(yīng)定勢(shì)。②偏好正面敘述的反應(yīng)定勢(shì),又成為肯定反應(yīng)定勢(shì),克倫巴赫發(fā)現(xiàn)。③偏好特殊位置的反應(yīng)定勢(shì)。吉爾福特認(rèn)為,被試如果完全不知道選擇題的正確答案,則不會(huì)以完全隨機(jī)的方式來決定該選擇哪一個(gè)選項(xiàng),而有偏好某一個(gè)位置的選項(xiàng)的傾向,而有些測(cè)驗(yàn)編制者也存在偏好某個(gè)位置的反應(yīng)定勢(shì),這些現(xiàn)象稱為位置定勢(shì)。④偏好較長(zhǎng)選項(xiàng)的反應(yīng)定勢(shì)。⑤猜測(cè)的反應(yīng)定勢(shì)。
四、猜測(cè)的校正
1.★猜測(cè)修正的公式:S=R-W/(n-1),其中,S是正確分?jǐn)?shù);R為被試答對(duì)的題目數(shù);W為被試答錯(cuò)的題目數(shù);n為選項(xiàng)數(shù)目。
2.☆猜測(cè)修正的優(yōu)缺點(diǎn)。優(yōu)點(diǎn):⑴修正公式可避免減低測(cè)驗(yàn)的信度。⑵修正公式可以反映被試真正的能力和水平。⑶使用修正公式對(duì)那些不能答完全部試題的被試來說比較公平。
缺點(diǎn):⑴公式假設(shè)不成立,因?yàn)楸辉嚧疱e(cuò)試題,并非完全瞎猜。⑵猜測(cè)修正無實(shí)質(zhì)作用。⑶未采用猜測(cè)修正對(duì)信度并無重大影響。⑷完全不許猜測(cè)與實(shí)際生活不符。
第二節(jié)實(shí)施測(cè)量計(jì)分的要領(lǐng)與誤差控制
檢驗(yàn)客觀與否,可以以兩個(gè)或兩個(gè)以上受過訓(xùn)練的合格評(píng)分者所評(píng)結(jié)果之間的一致性作為指標(biāo)。一般情況下,受過訓(xùn)練的評(píng)分者之間的平均一致性達(dá)到90%以上,我們就認(rèn)為計(jì)分是客觀的。
一、計(jì)分的一般程序
1.◆☆計(jì)分的基本步驟:⑴記錄反應(yīng)。及時(shí)和清楚地記錄被試的反應(yīng)。⑵檢索標(biāo)準(zhǔn)答案。標(biāo)準(zhǔn)答案有時(shí)又稱計(jì)分鍵。⑶反應(yīng)和標(biāo)準(zhǔn)答案的比較。
2.◇問答題的主要缺點(diǎn)是評(píng)分不夠客觀,也就是說問答題的計(jì)分經(jīng)常受到評(píng)分者的情感、態(tài)度的影響。問答題中常見的誤差有:寬容定勢(shì)和暈輪效應(yīng)。
3.◎?qū)捜荻▌?shì):指主試的計(jì)分過于寬松,即使沒有回答出題目所要求的答案,評(píng)分者也給予較高的分?jǐn)?shù)。
4.◎暈輪效應(yīng):指給予被試某道題較高分?jǐn)?shù)僅僅是由于被試在另外一些試題上獲得了高分,也就是說對(duì)被試的一般印象影響到具體某個(gè)問題的評(píng)價(jià)。
5.◎整體計(jì)分:就是評(píng)分者根據(jù)總體印象給答案評(píng)一個(gè)總分。整體計(jì)分在實(shí)際中應(yīng)用較為普遍。
6.◎分析計(jì)分:是給問答題的不同部分分派不同的權(quán)數(shù),按照各部分的要求對(duì)答案中所包括的信息和技能評(píng)分,最后將各部分的權(quán)數(shù)和得分組合起來得到該問答題的分?jǐn)?shù)。
比較整體計(jì)分和分析計(jì)分?(回答上面的名詞,再加以說明)
7.◇客觀題的一個(gè)主要優(yōu)點(diǎn)就是計(jì)分簡(jiǎn)單、客觀。
8.不同的反應(yīng)依據(jù)主試認(rèn)為的重要性不同也可以給予不同的權(quán)數(shù),我們還可以根據(jù)被試回答問題時(shí)的確定程度給予不同的權(quán)數(shù),這叫做“信心權(quán)數(shù)”◎。
第六章人事測(cè)量結(jié)果的解釋
人事測(cè)量的解釋不同于測(cè)量實(shí)施本身,它們是測(cè)量中兩個(gè)不同的、相對(duì)獨(dú)立的成分。測(cè)量的解釋是一個(gè)相當(dāng)復(fù)雜的系統(tǒng)程序。
第一節(jié)解釋的概念:為什么測(cè)量的實(shí)施與解釋相分離
1.◎原始分?jǐn)?shù):是通過將應(yīng)試者的反應(yīng)與標(biāo)準(zhǔn)答案相比較而直接獲得的,其本身并不具有多大的實(shí)用意義,而只是一個(gè)理論上的過渡值。
2.人事測(cè)量的目的在于評(píng)價(jià)和比較應(yīng)試者各方面的素質(zhì)和特點(diǎn)。
3.標(biāo)準(zhǔn)分:原始分?jǐn)?shù)通過與常模的比較,可以轉(zhuǎn)換成等值的導(dǎo)出分?jǐn)?shù),叫做標(biāo)準(zhǔn)分。
4.常模參照解釋:由測(cè)量的原始分?jǐn)?shù)通過與常模的對(duì)照得到可供比較的導(dǎo)出分?jǐn)?shù)的過程,就是測(cè)驗(yàn)分?jǐn)?shù)的解釋形式之一,稱為測(cè)量分?jǐn)?shù)的常模參照解釋。
5.效標(biāo)參照解釋:測(cè)量分?jǐn)?shù)的另一種解釋方式是參照效標(biāo)的分?jǐn)?shù)解釋,即效標(biāo)參照解釋,它是依據(jù)外在效標(biāo)作為標(biāo)準(zhǔn)來對(duì)應(yīng)試者的分?jǐn)?shù)進(jìn)行解釋。
6.☆常模參照解釋與效標(biāo)參照解釋的區(qū)別在于:常模參照解釋是將應(yīng)試者的成績(jī)與同類群體的其他人(常模樣本)的成績(jī)進(jìn)行比較,而效標(biāo)參照解釋是將應(yīng)試者成績(jī)與外在效標(biāo)(如二級(jí)技工的標(biāo)準(zhǔn))進(jìn)行比較。
第二節(jié)常模與基于常模的解釋
一、如何選擇常模樣本
1.確定常模樣本的過程包括:確定一般總體、確定目標(biāo)總體、確定常模樣本這三個(gè)步驟。
測(cè)驗(yàn)性質(zhì)的不同,文化教育水平不同,性別的不同,都可能影響常模。
2.◆☆在確定和選擇常模樣本時(shí)應(yīng)注意以下要求:⑴常模樣本的構(gòu)成必須明確。一個(gè)測(cè)驗(yàn)可能有許多常模樣本。在選取常模樣本時(shí),首先要保證常模樣本的所有成員是同質(zhì)◇的,可以相互比較。另外,要在測(cè)驗(yàn)手冊(cè)中對(duì)常模樣本進(jìn)行明確的說明,包括常模樣本的構(gòu)成和特性等。⑵常模樣本必須是所測(cè)群體的代表性樣本。⑶樣本大小要適當(dāng)?!簟畛D颖敬笮。慈哟笮。┯梢韵氯矫鏇Q定:①常模樣本大小決定于總體的規(guī)模??傮w規(guī)模小,如只有幾十個(gè)人,則常模樣本應(yīng)包括所有總體成員。如果總體數(shù)目大,相應(yīng)的樣本也應(yīng)較大,一般最低不應(yīng)少于30個(gè)或100個(gè)。②常模樣本大小決定于總體性質(zhì)??傮w性質(zhì)越復(fù)雜,越需要較大數(shù)量的樣本。③常模樣本大小決定于施測(cè)結(jié)果。◇樣本大小適當(dāng)?shù)年P(guān)鍵是樣本要有代表性。⑷注意常模的時(shí)效性。常模必須定期修訂。
3.◎取樣是指從目標(biāo)人群中選擇有代表性的樣本的過程。從統(tǒng)計(jì)角度看,取樣的方法有隨機(jī)抽樣和非隨機(jī)抽樣兩種。
4.☆在確定常模時(shí),常用的取樣方法有:⑴簡(jiǎn)單隨機(jī)抽樣;⑵系統(tǒng)抽樣。具體方法:假設(shè)總體數(shù)目為N,若要選擇K分之一的被試作為樣本,則可以把所有的人N分為N/K組,每個(gè)組選一個(gè)人,則剛好組成1/K的樣本?;蛘甙阉械娜藦?到N按序編號(hào),把所有編號(hào)是K的倍數(shù)的人抽取出來,即可組成所需樣本。需注意的是:在進(jìn)行系統(tǒng)抽樣時(shí),分組和從組中抽取,或者是編號(hào),都必須是隨機(jī)的。⑶分組抽樣;在總體數(shù)目較大,無法編號(hào),并且總體成員又具有多樣性的情況下,可以先將群體分為一定的小組,再從小組內(nèi)隨機(jī)抽樣。⑷分層抽樣。在確定常模樣本時(shí),最常用的是分層抽樣方法。它是先將目標(biāo)群體的某一種變量(如年齡)分成若干層次,如R個(gè)層次,再從各層次中隨機(jī)抽取若干個(gè)案。各層次的個(gè)案總和即為樣本個(gè)案數(shù)目。分層抽樣分為兩種方法:①分層比例抽樣法:如果各層抽取的個(gè)案數(shù)目ni是根據(jù)各層的個(gè)案數(shù)目Ni占總體數(shù)目N的比例而決定的。ni=Ni/N×n.②分層非比例抽樣:有些層次的重要性大于其他層次,這時(shí)應(yīng)該采用非比例抽樣方法。
二、常模的類型及解釋
1.◇常用的常摸有發(fā)展常模、百分位常模和標(biāo)準(zhǔn)分?jǐn)?shù)常模。
2.百分位常模包括百分等級(jí)、四分位數(shù)和十分位數(shù)。百分等級(jí)的計(jì)算關(guān)鍵在于確定在常模樣本中分?jǐn)?shù)低于某一特別分?jǐn)?shù)的人數(shù)比例,這可以分為兩種情況:一種情況是對(duì)沒有分組資料的數(shù)據(jù)分布求百分等級(jí),公式為:PR=100-100×(R-0.5)/N,其中R為排名順序,N為總?cè)藬?shù)。另一種情況是對(duì)有分組資料的數(shù)據(jù)求百分等級(jí)。公式:PR=100/N[(x-l)fp/h+cf],其中,x為任意原始分?jǐn)?shù);l為該原始分?jǐn)?shù)所在組的精確下限;fp為該分?jǐn)?shù)所在組的次數(shù);cf為l以下的累積次數(shù);h為組距。
在分?jǐn)?shù)量表上,相對(duì)于某一百分等級(jí)的分?jǐn)?shù)點(diǎn)叫百分點(diǎn)或百分位數(shù)。
3.◇常見的標(biāo)準(zhǔn)分?jǐn)?shù)有:z分?jǐn)?shù)、Z分?jǐn)?shù)、離差智商(IQ)、T分?jǐn)?shù)、標(biāo)準(zhǔn)九分等。由原始分?jǐn)?shù)轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù),又分為線性轉(zhuǎn)換和非線性轉(zhuǎn)換兩種。
4.z分?jǐn)?shù)為最典型的線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù),它是指以標(biāo)準(zhǔn)差為單位所表示的原始分?jǐn)?shù)與平均數(shù)的差距。
5.◎正態(tài)化的標(biāo)準(zhǔn)分?jǐn)?shù):當(dāng)原始分?jǐn)?shù)不呈正態(tài)分布時(shí),也可以進(jìn)行面積轉(zhuǎn)化,而使分?jǐn)?shù)轉(zhuǎn)成為正態(tài)分布。由這種方式所得到的分?jǐn)?shù)就叫正態(tài)化的標(biāo)準(zhǔn)分?jǐn)?shù)。為了使分?jǐn)?shù)正態(tài)化,必須有某種依據(jù)能假定所測(cè)特性的分?jǐn)?shù)事實(shí)上應(yīng)該是呈正態(tài)分布的。
◎正態(tài)化過程:先將原始分?jǐn)?shù)轉(zhuǎn)化為百分等級(jí),再將百分等級(jí)轉(zhuǎn)化為正態(tài)分布上相應(yīng)的離均值,并可以表示為任何平均數(shù)和標(biāo)準(zhǔn)差。
6.T分?jǐn)?shù):一詞最早是由麥柯爾1939年提出以紀(jì)念推孟和桑代克的,不過當(dāng)時(shí)僅用于12歲兒童的團(tuán)體,是根據(jù)某一特殊常模樣本而不是在一般意義上定義的?,F(xiàn)在有人用T分?jǐn)?shù)來表示任何正態(tài)化與非正態(tài)化的轉(zhuǎn)化標(biāo)準(zhǔn)系統(tǒng),只要其平均數(shù)為50,標(biāo)準(zhǔn)差為10即可。
7.標(biāo)準(zhǔn)九分:是另一較知名的標(biāo)準(zhǔn)分?jǐn)?shù)系統(tǒng),其量表是一個(gè)9
三、常模的表示方法
1.常摸表示的方法主要有兩種:轉(zhuǎn)化表和剖析圖。最簡(jiǎn)單而且最基本的表示常模的方法就是轉(zhuǎn)化表,也叫◎常模表,它由原始分?jǐn)?shù)表、相對(duì)應(yīng)的導(dǎo)出分?jǐn)?shù)表和對(duì)常模樣本的具體描述等三個(gè)要素組成?!罡鶕?jù)轉(zhuǎn)化表進(jìn)行解釋時(shí),須注意:常模轉(zhuǎn)化表總是特異性的,即一個(gè)轉(zhuǎn)化表總是來自特定的常模樣本的,這種轉(zhuǎn)化表只能表示被試在常模樣本內(nèi)的相對(duì)等級(jí),若要依此作出某種結(jié)論或預(yù)測(cè),需要進(jìn)一步的信度和效度的依據(jù)。
2.◎剖析圖是測(cè)驗(yàn)分?jǐn)?shù)的轉(zhuǎn)換關(guān)系用圖形表示出來的一種模式圖。使用剖析圖作解釋,要求各個(gè)分測(cè)驗(yàn)所使用的常模樣本必須相同,否則各分測(cè)分?jǐn)?shù)之間無法比較?!钜⒁獾囊粋€(gè)問題是:使用剖析圖容易夸大各個(gè)分測(cè)驗(yàn)間分?jǐn)?shù)的差異。為避免這個(gè)問題,有些剖析圖注明了多少距離代表兩分?jǐn)?shù)間差異顯著,使用者可以依此很快地確定某對(duì)分?jǐn)?shù)間是否存在差異。另一種方法是將被試分?jǐn)?shù)用一段范圍表示,假如范圍不重疊,表明分?jǐn)?shù)間有顯著差異存在。
第三節(jié)效標(biāo)與基于效標(biāo)的解釋
◇效標(biāo)參照測(cè)驗(yàn)關(guān)心的是應(yīng)試者是否達(dá)到了某種標(biāo)準(zhǔn)或效標(biāo)。參照效標(biāo)的分?jǐn)?shù)解釋分為內(nèi)容參照分?jǐn)?shù)的解釋及結(jié)果參照分?jǐn)?shù)的解釋兩種類型。
一、內(nèi)容參照分?jǐn)?shù)的解釋
1.內(nèi)容參照分?jǐn)?shù)的測(cè)量目的是確定應(yīng)試者對(duì)某個(gè)確定材料內(nèi)容或技能的掌握和熟悉程度的分?jǐn)?shù)。
☆編制內(nèi)容參照測(cè)量表的關(guān)鍵是預(yù)先制定一個(gè)判斷應(yīng)試者是否已掌握某種內(nèi)容或技能的熟練程度的標(biāo)準(zhǔn)。這種標(biāo)準(zhǔn)可以通過掌握分?jǐn)?shù)和正確百分?jǐn)?shù)來表示。掌握分?jǐn)?shù),最簡(jiǎn)單的掌握分?jǐn)?shù)的標(biāo)準(zhǔn)是定一個(gè)判別應(yīng)試者是否通過或掌握的最低分?jǐn)?shù)正確百分?jǐn)?shù),表明被試在測(cè)驗(yàn)中答對(duì)題目的比例。
二、結(jié)果參照分?jǐn)?shù)的解釋
◎結(jié)果參照分?jǐn)?shù):是將效標(biāo)材料直接結(jié)合到測(cè)驗(yàn)結(jié)果的解釋過程而進(jìn)行評(píng)價(jià)的分?jǐn)?shù)。預(yù)測(cè)性測(cè)驗(yàn)往往適合用結(jié)果參照分?jǐn)?shù)進(jìn)行解釋。
第七章人事測(cè)量的關(guān)鍵技術(shù):信度
第一節(jié)人事測(cè)量的可靠性—信度
一、信度的定義
1.◇信度主要是指測(cè)量結(jié)果的可靠性或一致性。
2.系統(tǒng)誤差:量具本身有誤差,這種誤差是必然的,但卻是有規(guī)律的。隨機(jī)誤差:每一次測(cè)量都可能有操作上的差異,或者由于不可預(yù)見的外界因素的影響,從而造成誤差,這些誤差也是難免的,但卻是毫無規(guī)律的。
二、信度的作用
1.◎信度系數(shù):信度高低的指標(biāo)通常以相關(guān)系數(shù)表示,稱為信度系數(shù)。信度系數(shù)一般是同一樣本所得的兩組資料的相關(guān),在理論上表示為實(shí)得分?jǐn)?shù)與真實(shí)分?jǐn)?shù)相關(guān)的平方。rxx=rxr2=ST2/SX2,其中rxr=ST/SX有時(shí)也稱為信度指數(shù),它是真實(shí)分?jǐn)?shù)標(biāo)準(zhǔn)差與實(shí)得分?jǐn)?shù)標(biāo)準(zhǔn)差的比率。信度系數(shù)的分布是從0.00~1.00的正數(shù)范圍。
2.◇一般來說,當(dāng)rxx 0.70時(shí),不能用測(cè)驗(yàn)對(duì)個(gè)人作評(píng)價(jià),也不能在團(tuán)體間作比較;當(dāng)rxx 0.70時(shí),可用于團(tuán)體間比較;rxx 0.85時(shí),可用于鑒別個(gè)人。rxx指信度。
第二節(jié)如何評(píng)估人事測(cè)量的信度
一、重測(cè)信度
1.◎重測(cè)信度又稱為穩(wěn)定性系數(shù),它的計(jì)量方法是采用重測(cè)法:用同一測(cè)驗(yàn),在不同時(shí)間對(duì)同一群體施測(cè)兩次,這兩次測(cè)量分?jǐn)?shù)的相關(guān)系數(shù)即為重測(cè)系數(shù)。
重測(cè)信度所考察的誤差來源是時(shí)間的變化所帶來的隨機(jī)影響。在評(píng)估重測(cè)信度時(shí),必須注意重測(cè)間隔的時(shí)間。對(duì)于人格測(cè)驗(yàn),重測(cè)間隔在兩周到6個(gè)月之間比較合適。
☆在進(jìn)行重測(cè)信度的評(píng)估時(shí),還應(yīng)注意以下兩個(gè)重要問題:⑴重測(cè)信度一般只反映由隨機(jī)因素導(dǎo)致的變化,而不反映被試行為的長(zhǎng)久變化。⑵不同的行為受隨機(jī)誤差影響不同。
二、復(fù)本信度
1.◎復(fù)本信度又稱等值性系數(shù),它是以兩個(gè)測(cè)驗(yàn)復(fù)本來測(cè)量同一群體,然后求得應(yīng)試者在這兩個(gè)測(cè)驗(yàn)上得分的相關(guān)系數(shù)。復(fù)本信度的高低反映了這兩個(gè)測(cè)驗(yàn)復(fù)本在內(nèi)容上的等值性程度。兩個(gè)等值的測(cè)驗(yàn)互為復(fù)本。
2.◇計(jì)算復(fù)本信度的主要目的在于考察兩個(gè)測(cè)驗(yàn)復(fù)本的題目取樣或內(nèi)容取樣是否等值。復(fù)本信度也考慮兩個(gè)復(fù)本實(shí)施的時(shí)間間隔。
3.☆復(fù)本信度的主要優(yōu)點(diǎn)在于:⑴能夠避免重測(cè)信度的一些問題,如記憶效果、練習(xí)效應(yīng)等;⑵適用于進(jìn)行長(zhǎng)期追蹤研究或調(diào)查某些干涉變量對(duì)測(cè)驗(yàn)成績(jī)影響;⑶減少了輔導(dǎo)或作弊的可能性。☆復(fù)本信度的局限性在于:⑴如果測(cè)量的行為易受練習(xí)的影響,則復(fù)本信度只能減少而不能消除這種影響;⑵有些測(cè)驗(yàn)的性質(zhì)會(huì)由于重復(fù)而發(fā)生改變;⑶有些測(cè)驗(yàn)很難找到合適的復(fù)本。
三、內(nèi)部一致性信度
1.◎內(nèi)部一致性信度系數(shù)主要反映的是測(cè)驗(yàn)內(nèi)部題目之間的關(guān)系,考察測(cè)驗(yàn)的各個(gè)題目是否測(cè)量了相同的內(nèi)容或特質(zhì)。內(nèi)部一致性信度又分為分半信度和同質(zhì)性信度。
2.分半信度系數(shù)是通過將測(cè)驗(yàn)分成兩半,計(jì)算這兩半測(cè)驗(yàn)之間的相關(guān)性而獲得的信度系數(shù)。測(cè)驗(yàn)愈長(zhǎng),信度系數(shù)愈高。同質(zhì)性信度是指測(cè)驗(yàn)內(nèi)部的各題目在多大程度上考察了同一內(nèi)容。同質(zhì)性信度低時(shí),即使各個(gè)測(cè)試題看起來似乎是測(cè)量同一特質(zhì),但測(cè)驗(yàn)實(shí)際上是異質(zhì)的,即測(cè)驗(yàn)測(cè)量了不止一種特質(zhì)。同質(zhì)性分析與項(xiàng)目分析中的內(nèi)部一致性分析相類似。
四、評(píng)分者信度
1.◎評(píng)分者信度:是指不同評(píng)分者對(duì)同樣對(duì)象進(jìn)行評(píng)定時(shí)的一致性。最簡(jiǎn)單的估計(jì)方法就是隨機(jī)抽取若干份答卷,由兩個(gè)獨(dú)立的評(píng)分者打分,再求每份答卷兩個(gè)評(píng)判分?jǐn)?shù)的相關(guān)系數(shù)。這種相關(guān)系數(shù)的計(jì)算可以用積差相關(guān)方法,也可以采用斯皮爾曼等級(jí)相關(guān)方法。
2.如果評(píng)分者在三人以上,而且又采用等級(jí)記分時(shí),就需要用肯德爾和諧系數(shù)來求評(píng)分者信度。
3.信度估計(jì)方法及其與測(cè)驗(yàn)復(fù)本和施測(cè)次數(shù)的關(guān)系:
所需次數(shù)
所需復(fù)本數(shù)
分半信度,同質(zhì)性信度
復(fù)本信度(連續(xù)施測(cè))
重測(cè)信度
重測(cè)復(fù)本信度
4.各種信度系數(shù)相應(yīng)的誤差來源(這里都是隨機(jī)誤差):
信度系數(shù)類型
誤差方差來源
重測(cè)信度
復(fù)本信度(連續(xù)施測(cè))
重測(cè)復(fù)本信度
分半信度
同質(zhì)性信度
評(píng)分者信度
時(shí)間取樣
內(nèi)容取樣
時(shí)間取樣和內(nèi)容取樣
內(nèi)容取樣
內(nèi)容的異質(zhì)性
評(píng)分者間差異
第三節(jié)影響信度的因素
對(duì)測(cè)驗(yàn)的信度造成影響的因素主要有:樣本團(tuán)體的性質(zhì)、測(cè)驗(yàn)的長(zhǎng)度、測(cè)驗(yàn)難度。
一、樣本團(tuán)體的性質(zhì)對(duì)信度的影響主要有以下三個(gè)方面:⑴樣本團(tuán)體的分?jǐn)?shù)分布。分?jǐn)?shù)分布越廣,信度系數(shù)就相對(duì)越高,分?jǐn)?shù)分布越窄,信度系數(shù)就會(huì)越低。⑵樣本團(tuán)體的異質(zhì)性。信度系數(shù)還會(huì)受到樣本團(tuán)體異質(zhì)性的影響。一般來說,取樣團(tuán)體的異質(zhì)性越大,信度系數(shù)就相對(duì)越高。⑶不同團(tuán)體間能力水平的差異。
二、測(cè)驗(yàn)長(zhǎng)度對(duì)信度的影響:信度還會(huì)受測(cè)驗(yàn)長(zhǎng)度的影響。一般來說,測(cè)驗(yàn)越長(zhǎng),信度值越高。一方面,測(cè)驗(yàn)越長(zhǎng),題目取樣或內(nèi)容取樣就越充分,結(jié)果就越可靠。另一方面,較長(zhǎng)的測(cè)驗(yàn)也不容易受到猜測(cè)的影響。
三、測(cè)驗(yàn)的難度。只有當(dāng)測(cè)驗(yàn)的難度水平能夠使測(cè)驗(yàn)分?jǐn)?shù)分布范圍最大時(shí),測(cè)驗(yàn)的信度才會(huì)比較理想。測(cè)驗(yàn)的長(zhǎng)度和難度會(huì)共同起作用。
第八章人事測(cè)量的關(guān)鍵技術(shù):效度
第一節(jié)人事測(cè)量的有效性
一、◇測(cè)量的效度就是指測(cè)量的有效性,即能測(cè)量到所要測(cè)量的目標(biāo)的程度。
二、◎效度的理論定義:從測(cè)量理論角度講,效度可以定義為:與測(cè)量目標(biāo)有關(guān)的真實(shí)分?jǐn)?shù)方差與總分方差的比率。“有關(guān)真實(shí)分?jǐn)?shù)方差”是由測(cè)驗(yàn)所要測(cè)量的目標(biāo)變量所產(chǎn)生的方差。效度的定義用公式可以表示為:rXY=SV2/SX2,其中rXY為測(cè)驗(yàn)效度;SV2為有效方差;SX2為總方差。
二、★☆信度和效度的關(guān)系:信度主要是指測(cè)量結(jié)果的可靠性或一致性。效度指測(cè)量的有效性,即能測(cè)量到所要測(cè)量的目標(biāo)的程度。差別在于:考慮的誤差不同。①信度考慮的是隨機(jī)誤差的影響;②效度的誤差則還包括對(duì)測(cè)驗(yàn)?zāi)康膩碚f無關(guān)的變量所引起的系統(tǒng)誤差。誤差方差低(即信度高)并不保證效度就一定高;但效度高的話,信度必然要高。信度是效度的必要條件。
三、效度的性質(zhì)。效度是連續(xù)性的,效度高低只是程度上的差別,它不是“全有”或“全無”的變量。我們應(yīng)避免評(píng)價(jià)某一測(cè)驗(yàn)的結(jié)果為“有效”或“無效”,而應(yīng)區(qū)分效度較高或較低。
第二節(jié)如何評(píng)估人事測(cè)量的效度
根據(jù)評(píng)估效度方法的不同,效度可以分為內(nèi)容效度、構(gòu)想效度和效標(biāo)關(guān)聯(lián)效度這三類。
一、內(nèi)容效度
1.◎內(nèi)容效度:是檢查測(cè)驗(yàn)內(nèi)容是否是所欲測(cè)量的行為領(lǐng)域的代表性取樣的指標(biāo)。例如,成就測(cè)驗(yàn)往往采用內(nèi)容效度的評(píng)估方法。
2.☆內(nèi)容效度分析時(shí)要注意兩方面的問題:⑴應(yīng)避免將測(cè)驗(yàn)取樣的行為領(lǐng)域過于泛化。⑵要注意測(cè)驗(yàn)分?jǐn)?shù)種無關(guān)因素的影響。
3.內(nèi)容效度的確定一般沒有可用的數(shù)量化指標(biāo),只能靠推理和判斷來進(jìn)行評(píng)估?!蟆糨^好的內(nèi)容效度依賴于兩個(gè)條件:⑴測(cè)驗(yàn)內(nèi)容范圍明確。⑵測(cè)驗(yàn)內(nèi)容的取樣有代表性。
4.內(nèi)容效度最適合于評(píng)估教育和職業(yè)成就測(cè)驗(yàn)。◇效標(biāo)參照測(cè)驗(yàn)應(yīng)用的基本條件是具備足夠的內(nèi)容效度。
二、效標(biāo)關(guān)聯(lián)效度
1.◎效標(biāo)關(guān)聯(lián)效度:又稱為效標(biāo)效度,反映的是測(cè)驗(yàn)分?jǐn)?shù)與外在標(biāo)準(zhǔn)(效標(biāo))的相關(guān)程度,即測(cè)驗(yàn)分?jǐn)?shù)對(duì)個(gè)體的效標(biāo)行為表現(xiàn)進(jìn)行預(yù)測(cè)的有效性程度。
2.◇效標(biāo)是考察測(cè)驗(yàn)效用的外在參照標(biāo)準(zhǔn)。
3.◎預(yù)測(cè)效度的效標(biāo)資料往往是測(cè)量結(jié)束后隔一段時(shí)間才獲得,它反映的是由測(cè)驗(yàn)分?jǐn)?shù)對(duì)任一段時(shí)間間隔后被試行為表現(xiàn)的預(yù)測(cè)程度。預(yù)測(cè)效度適用于那些對(duì)人員進(jìn)行選拔、分類和安置的人事測(cè)驗(yàn),這些測(cè)驗(yàn)需要對(duì)應(yīng)試者將來的工作績(jī)效進(jìn)行可靠的預(yù)測(cè)。
4.◇同時(shí)效度的效標(biāo)材料可以和測(cè)驗(yàn)分?jǐn)?shù)差不多同時(shí)搜集。
5.要測(cè)量效標(biāo),就必須把效標(biāo)行為轉(zhuǎn)化為某種可以操作的測(cè)量指標(biāo),以便進(jìn)行比較。這種操作的測(cè)量指標(biāo)就稱為效標(biāo)測(cè)量◎。效標(biāo)的概念可以細(xì)分為觀念效標(biāo)(即效標(biāo)的實(shí)質(zhì)概念內(nèi)容)和效標(biāo)測(cè)量(效標(biāo)的具體度量方法)。
6.◇效標(biāo)污染是指由于評(píng)定者知道測(cè)驗(yàn)分?jǐn)?shù)而影響個(gè)人的效標(biāo)成績(jī)的情形。
7.常用的效標(biāo)包括:學(xué)術(shù)成就、特殊訓(xùn)練成績(jī)、實(shí)際工作表現(xiàn)、團(tuán)體對(duì)照、等級(jí)評(píng)定、先前有效的測(cè)驗(yàn)。
8.評(píng)定可以作為任何測(cè)驗(yàn)的效標(biāo),尤其適合人格測(cè)驗(yàn)。
三、構(gòu)想效度
◎構(gòu)想效度:是指測(cè)驗(yàn)?zāi)軌驕y(cè)量到理論上的構(gòu)想或特質(zhì)的程度。所謂構(gòu)想通常指一些抽象的、假設(shè)性的概念或特質(zhì),如智力、創(chuàng)造力、言語流暢性、焦慮等。
上一頁