位置：首頁 > 自考專業(yè)

自考“社會調(diào)查原理與方法”復(fù)習(xí)資料第十二章

發(fā)布時間：2024-09-15 16:21:23
來源：本站整理
閱讀：

導(dǎo)讀：: 　　第十二章資料的統(tǒng)計分析——重點
　　[由于有公式，如果大家需要word版本請發(fā)郵件到info@cntopedu.cn索取]
　　資料分析是在資料審核和整理的基礎(chǔ)上進(jìn)行的，包括統(tǒng)計分析、邏輯和理論分析。
　　第一節(jié) 統(tǒng)計分析的必要性與特點
　　一、統(tǒng)計分析的必要性
　　1.統(tǒng)計分析的方法可以為我們的研究提供一種清晰精確的形式

第十二章資料的統(tǒng)計分析——重點

[由于有公式，如果大家需要word版本請發(fā)郵件到info@cntopedu.cn索取]

資料分析是在資料審核和整理的基礎(chǔ)上進(jìn)行的，包括統(tǒng)計分析、邏輯和理論分析。

第一節(jié) 統(tǒng)計分析的必要性與特點

一、統(tǒng)計分析的必要性

1.統(tǒng)計分析的方法可以為我們的研究提供一種清晰精確的形式化語言。

2.統(tǒng)計分析是進(jìn)行科學(xué)預(yù)測，探索未來的重要方法。

3.新的調(diào)查方法和技術(shù)要求運(yùn)用統(tǒng)計分析的方法。

二、統(tǒng)計分析的特點

1.統(tǒng)計分析要以定性分析為基礎(chǔ)，其原因是：

1 統(tǒng)計分析是根據(jù)數(shù)據(jù)資料進(jìn)行的，社會調(diào)查中的數(shù)據(jù)反映事物屬性的統(tǒng)計指標(biāo)。

2 統(tǒng)計分析依據(jù)一定公式計算，公式的選擇依賴于一定的理論知識、專業(yè)知識和必要的經(jīng)驗。

2.統(tǒng)計分析方法必須和其他分析方法結(jié)合運(yùn)用，原因是 1 數(shù)量關(guān)系只是客觀事物存在的諸種關(guān)系的一種，不能代替其他分析方法； 2 統(tǒng)計分析方法能夠幫助發(fā)現(xiàn)社會現(xiàn)象中不易察覺的規(guī)律，但解釋需要借助于有關(guān)科學(xué)的理論。

3.統(tǒng)計分析有一套專門的方法和技術(shù)。

第二節(jié) 集中量數(shù)分析

一、集中量數(shù)分析的意義和作用

1.集中量數(shù)，又稱為集中趨勢，是一組數(shù)據(jù)的代表值，代表著現(xiàn)象的一般水平，別的數(shù)值圍繞在它的周圍；能對同質(zhì)總體做出概括說明，用以反映數(shù)據(jù)資料集中趨勢和特征的一般水平P330，具有四個方面的作用（意義）：

1 說明某一社會現(xiàn)象在一定條件下，其數(shù)量的一般水平。

2 對于不同空間的同類現(xiàn)象進(jìn)行比較。

3 對一定社會現(xiàn)象在不同時間中的變化進(jìn)行比較。

4 分析某些社會現(xiàn)象之間的依存關(guān)系。

2.常用的集中數(shù)量包括算術(shù)平均數(shù)、中位數(shù)和眾數(shù)。

二、算術(shù)平均數(shù)

含義：以總體各單位數(shù)值之間和除以總體單位總數(shù)的商，計算公式：

各單位的標(biāo)志數(shù)值之和

總體單位總數(shù)

算術(shù)平均數(shù)=

根據(jù)資料的不同，算術(shù)平均數(shù)可以采用簡單算術(shù)平均數(shù)和加權(quán)算術(shù)平均數(shù)法進(jìn)行計算

（一）簡單算術(shù)平均數(shù)，是直接由原始數(shù)據(jù)計算平均數(shù)的方法，公式：

說明：符號X表示算術(shù)平均數(shù)；X1、X2分別表示各個具體的標(biāo)志數(shù)值；n代表總體單位數(shù)（即總體中個案的數(shù)目）。

X1+X2+……+Xn

∑X

X= =

（二）加權(quán)算術(shù)平均數(shù)，使用第二手資料的統(tǒng)計表計算平均數(shù)的時候，要用加權(quán)平均數(shù)法進(jìn)行計算，計算公式：

X1f1+X2f2+……+Xnfn

f1+f2+……+fn

∑Xf

∑f

說明：f位權(quán)數(shù)，即在變量在總體中出現(xiàn)的次數(shù)

X= =

按照數(shù)據(jù)資料形式的差異，加權(quán)平均數(shù)的計算分為由單項分組資料求算術(shù)平均數(shù)和由組距分組資料求算術(shù)平均數(shù)：

1.單項分組資料算術(shù)平均數(shù)，公式與加權(quán)算術(shù)平均數(shù)一致，特點：變量X的每一個值都是單一的確定數(shù)值。

2.由組距分組資料求算術(shù)平均數(shù)，特點：變量X不是一組確定的數(shù)值，是一組數(shù)據(jù)區(qū)間；要求：先計算出組中距，然后使用加權(quán)算術(shù)平均數(shù)進(jìn)行計算。

1 組中距的符號：Xmid，計算公式：Xmid=（下組限+上組限）/2

∑fXmid

∑f

2 組距分組資料計算算術(shù)平均數(shù)的公式：X=

三、中位數(shù)

含義：中位數(shù)是把調(diào)查到的資料按照標(biāo)志值大小順序排列，處于中央位置的標(biāo)志值表示中間位置的平均數(shù)，又稱位置平均數(shù)，主要應(yīng)用于非數(shù)值的定序測量資料中。計算定序變量的集中量數(shù)用中位數(shù)，只需指出中位數(shù)的位置；計算定距變量的集中量數(shù)可以用中位數(shù)，但要計算出其中的具體數(shù)值。

（一）由原始資料計算中位數(shù)，步驟：把各個標(biāo)志數(shù)值按照大小排列，然后用總體單位加1除以2，可以求出中位數(shù)的位次。

（二）對經(jīng)過匯總的資料計算中位數(shù)，主要包括：

1.由單項分組資料求中位數(shù)，步驟：首先找出中位數(shù)的位次（n+1/2），然后順著累計次數(shù)找到對應(yīng)的組內(nèi)。

2.由組距分組資料計算中位數(shù)，步驟：用∑f/2公式確定中位數(shù)所在組的位置，然后用下限公式計算中位數(shù)，公式為：

說明：Md 為中位數(shù)，L為中位數(shù)所在組的下限，fm 為中位數(shù)所在組的次數(shù)， cfm-1 為中位數(shù)所在組以下的累計次數(shù)，∑f 為累計次數(shù)，i為中位數(shù)所在組的組距。

∑f-cfm-1

×i+L

Md=

第三節(jié) 離中量數(shù)分析—重點

一、離中量數(shù)的意義和作用

1.離中量數(shù)，也稱差異量數(shù)，是描述數(shù)據(jù)離散程度的量數(shù)，是一個概括性量值，是研究現(xiàn)象差異程度的概括表現(xiàn)；要求兩組數(shù)據(jù)的集中量數(shù)大致相同，單位相同，兩組數(shù)據(jù)的總體單位相近，才可比較。P335

2.離中量數(shù)的作用（意義）： 1 闡明被研究對象的差異特征； 2 描述一組數(shù)據(jù)的差異情況； 3 對集中數(shù)量的代表性作了補(bǔ)充說明，即差異量數(shù)越小，集中量數(shù)的代表性越大。

二、離中量數(shù)的計算

離中量數(shù)的計算方法有異眾比率（與眾數(shù)配合）、四分位差（與中位數(shù)配合）和標(biāo)準(zhǔn)差（平均數(shù)配合）

（一）異眾比率，是指非眾數(shù)的次數(shù)與總體內(nèi)全部總體單位的比率。

說明：VR代表異眾比率，n是總體內(nèi)全部總體單位的數(shù)，fmo為眾數(shù)的次數(shù)。

n-fmo

1. 計算公式：VR=

2.異眾比率與眾數(shù)成反比關(guān)系：異眾比率較大，眾數(shù)的代表小，異眾比率越小，眾數(shù)的代表性越大。

（二）四分位差

1.含義：

1 把一組數(shù)據(jù)按大小排列成序，然后分成四個數(shù)據(jù)數(shù)目相等段落，各段落分界點上的數(shù)稱四分位數(shù)。

2 第一個四分為數(shù)（Q1）以下包括了25%的數(shù)據(jù)，第二個四分位數(shù)（Q2）包括以下75%的數(shù)據(jù)，

3 3（n+1） n+1

4 4

四分位差是指舍去資料中的數(shù)值最高的25%數(shù)據(jù)和數(shù)值最低的25%數(shù)據(jù)，僅就屬于中間的50%數(shù)據(jù)求其量數(shù)作為離中量數(shù)。

2.定序類型資料計算的四分位差，計算公式：Q= Q3-Q1= -

Q3-Q1

3 1

4n n

3.對于定距類型資料計算四分位差，計算公式：Q= = -

4.四分位差與中位數(shù)的關(guān)系：四分位差之間的間距越小，中位數(shù)的代表性越大。

（三）標(biāo)準(zhǔn)差

含義：也稱均方差，指資料中各個數(shù)值與算術(shù)平均數(shù)相減的平方和的算術(shù)平均數(shù)的平方根，是用的最多、最重要的離中量數(shù)，標(biāo)準(zhǔn)差越小，平均數(shù)的代表性越大。

∑f（Xi-X）2

說明：Xi為資料中各個數(shù)值，X為算術(shù)平均數(shù)，n為總體單位數(shù)。

計算公式：σ=

√

根據(jù)資料的不同，標(biāo)準(zhǔn)差分為按原始資料計算和按統(tǒng)計表資料計算兩種方法。

1.根據(jù)原始資料計算標(biāo)準(zhǔn)差，計算公式與標(biāo)準(zhǔn)差計算公式相同。

2.根據(jù)統(tǒng)計表資料計算標(biāo)準(zhǔn)差，包括

1 單值分組資料計算標(biāo)準(zhǔn)差，計算公式與原始資料計算標(biāo)準(zhǔn)差相同。

∑f（Xmid-X）2

2 √

σ=

組距資料計算標(biāo)準(zhǔn)差，計算公式為：

三、相對差異量數(shù)

1.離散系數(shù)，是標(biāo)準(zhǔn)差與算術(shù)平均數(shù)的比值，是一個相對數(shù)，不受單位限制，離散系數(shù)越大，數(shù)據(jù)的離散程度越大，集中量數(shù)的代表性越小，限制：離散系數(shù)的比較只限于定距資料。

公式：CV= ×100%

2.標(biāo)準(zhǔn)分?jǐn)?shù)，作用（1）表明原始數(shù)據(jù)在總體分布中的相對位置；（2）對不同的各原始數(shù)據(jù)進(jìn)行比較。（3）能測定相同或不同總體內(nèi)個案的相對位置，并進(jìn)行比較，是比較分析的有力工具。

X-X

計算公式：Z=

第四節(jié) 相關(guān)與回歸分析

一、相關(guān)分析的意義和測定方法

1.相關(guān)分析含義：是通過計算兩個變量的相關(guān)系數(shù)來判斷兩個現(xiàn)象是否有聯(lián)系以及聯(lián)系的密切程度，只是對客觀事物的一種描述。

2.散點圖，橫坐標(biāo)代表一個變量，縱坐標(biāo)代表另一個變量，對各資料依次用坐標(biāo)點繪于圖上，這圖稱為散點圖，可以說明變量間有無線性相關(guān)關(guān)系、相關(guān)的方向，不能精確地說明變量之間的密切程度。

3.相關(guān)系數(shù)的計算方法

1 相關(guān)系數(shù)是表明變量間關(guān)系密切程度的量數(shù)，符號為r，取值范圍在-1到+1之間，具體取值為：

（1）r=-1，完全負(fù)相關(guān)；（2）r=1，完全正相關(guān)；（3）r=0，無相關(guān)；（4）r是負(fù)值，說明隨著X變量的增大，Y變量減小，兩個變量變化的方向相反；（5）r是正值，說明隨著X變量的增大，Y變量也隨著增大，兩個變量變化的方向相同；（6）|r|=0.7-1.0之間認(rèn)為兩變量具有高度相關(guān)；（7）|r|=0.3-0.7之間認(rèn)為兩個變量之間具有中度相關(guān)；（8）|r|=0-0.3之間認(rèn)為是低度相關(guān)。

n∑XY-（∑X）。（∑Y）

[n∑X2-（∑X）2].[n∑Y2-（∑Y）2]

2 √

相關(guān)關(guān)系的計算公式：r=

二、回歸分析的意義和方法

1.含義：是對有相關(guān)關(guān)系的對象，根據(jù)關(guān)系的形態(tài)選一合適的數(shù)學(xué)模型用來近似地表達(dá)變量間平均變化關(guān)系；具有推理性質(zhì)和因果性，是單向的，可以進(jìn)行預(yù)測。

2.一元回歸模型和計算

1 散點圖上坐標(biāo)點在統(tǒng)計上可以用一條直線表示，即回歸直線，但每條直線與實際值都有一定的偏差。因此回歸計算目的是找出一條最佳回歸線，使它與實際數(shù)值的偏差為最小。

n∑XY-（∑X）。（∑Y）

n∑X2-（∑X）2

數(shù)學(xué)模型為：Y=a+bX（其中a為直線在Y軸上的截距，b為直線的斜率，也稱回歸系數(shù)，標(biāo)準(zhǔn)方程為：

a=Y-bX

∑Y=na+b∑X

∑XY=a∑X+b∑X2

3.相關(guān)關(guān)系和回歸分析應(yīng)注意的機(jī)關(guān)問題

1 相關(guān)是回歸的必要條件； 2 相關(guān)關(guān)系不僅可以說明變量之間關(guān)系的密切程度，還可以度量回歸方程對實際資料的擬合優(yōu)度。以r2為判斷系數(shù)，r值越大，r2也越大，則擬合程度越好。相關(guān)系數(shù)越高，預(yù)測的準(zhǔn)確性越大。 3 應(yīng)用回歸方程式進(jìn)行預(yù)測時，不能使用超出資料所包括范圍的自變量數(shù)值。 4 預(yù)測的回歸方程只能反映一定時期內(nèi)事物間的相互關(guān)系。

第五節(jié) 推論統(tǒng)計

推論統(tǒng)計是一門通過樣本的各種量數(shù)估計總體與之對應(yīng)的各種量數(shù)的學(xué)問，方法包括區(qū)間估計和假設(shè)檢驗。

一、區(qū)間估計

（一）區(qū)間估計的概念

1.含義：是在一定的標(biāo)準(zhǔn)差范圍內(nèi)設(shè)立一個置信區(qū)間，然后聯(lián)系這個區(qū)間的可信度將樣本統(tǒng)計推論為總體參數(shù)值。

2.只要被抽取的部分單位中被研究標(biāo)志的構(gòu)成比例與總體有出入，就會產(chǎn)生誤差，是隨機(jī)抽樣本所固有的，稱為抽樣誤差，而描述抽樣誤差的量數(shù)稱為標(biāo)準(zhǔn)誤差σX=σ/√n

3.標(biāo)準(zhǔn)誤差主要取決于兩個因素：總體標(biāo)準(zhǔn)差和樣本量。

4.只要樣本大于30個個案，可以用樣本標(biāo)準(zhǔn)差S代替總體標(biāo)準(zhǔn)差σX

5.樣本誤差的大小和樣本的多少是決定精確度的一個因素。

6.幾個重要的數(shù)據(jù)：社會統(tǒng)計中常用的置信度為90%、95%、99%，與之對應(yīng)它們允許誤差（α）分別為10%、5%、1%，置信度Z（1-α）分別為1.65、1.96、2.58

（二）總體平均值的區(qū)間估計法

1. 說明：S為樣本差；n為樣本數(shù)目；隨著可靠性的提高，置信度間在擴(kuò)大，精確度降低。

√

總體平均數(shù)的區(qū)間估計，公式：X±Z（1-α）

2.總體百分比的區(qū)間估計，公式：P為樣本中的百分比。

P（1-P）

√

P±Z（1-α）

二、假設(shè)檢驗（P348-350具體理解）

1.含義：假設(shè)檢驗就是先對總體的某一參數(shù)作一假設(shè)，然后用樣本計量去驗證，以決定假設(shè)是否為總體接受。

2.根據(jù)對某一總體特征的初步了解而作出的假設(shè)稱為虛無假設(shè)；將根據(jù)抽樣調(diào)查資料而作出的假設(shè)稱為研究假設(shè)。（兩個假設(shè)絕對對立）。

3.通常把概率不超過0.05或0.01的事件當(dāng)作“小概率事件”，也稱為顯著水平。

關(guān)于自考“社會調(diào)查原理與方法”復(fù)習(xí)資料第十二章文章

自考“社會調(diào)查原理與方法”復(fù)習(xí)資料第十二章

相關(guān)閱讀

熱門標(biāo)簽

關(guān)于自考“社會調(diào)查原理與方法”復(fù)習(xí)資料第十二章文章

熱門文章