1 簡述什么是集中趨勢?
答:集中趨勢,是指一組數(shù)據(jù)向其中心值靠攏的傾向,測度集中趨勢就是確定數(shù)據(jù)一般水平的代表值或中心值,用于代表數(shù)據(jù)總體的一般水平。
2 眾數(shù)(mode)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值。眾數(shù)的一個(gè)突出特點(diǎn)是它不受極端數(shù)值的影響。眾數(shù)的格式:MODE
3 眾數(shù)的基本思想,是反映一組數(shù)據(jù)若存在某種集中趨勢,則大量數(shù)據(jù)會集中在某個(gè)或某幾個(gè)數(shù)據(jù)點(diǎn)上,即在這個(gè)數(shù)據(jù)點(diǎn)上,變量值出現(xiàn)的頻數(shù)會較高,眾數(shù)就是這一數(shù)據(jù)點(diǎn)的取值。所以眾數(shù)表達(dá)的是數(shù)據(jù)分布的“重心”。
4 中位數(shù)(median)是一組數(shù)據(jù)排序后處于中間位置的變量值,是一組數(shù)據(jù)的中點(diǎn),即高于和低于它的數(shù)據(jù)各占一半。中位數(shù)是一組數(shù)據(jù)的位置“中心”,反映了數(shù)據(jù)分布存在的位置中心趨勢。當(dāng)一組數(shù)據(jù)的個(gè)數(shù)為偶數(shù)時(shí),中位數(shù)為排序后的中間兩個(gè)變量值的算術(shù)平均數(shù)。中位數(shù)的格式:MEDIAN
5 均值(mean)在統(tǒng)計(jì)學(xué)中有重要地位,是數(shù)據(jù)分布集中趨勢的主要測度值,用于反映一組數(shù)值型數(shù)據(jù)的一般水平。根據(jù)情況的不同在計(jì)算均值時(shí)有不同的形式,分為:算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)。
6 算術(shù)平均數(shù)是對一組數(shù)值數(shù)據(jù)計(jì)算算術(shù)平均,用 表示。根據(jù)數(shù)據(jù)資料的不同,分為簡單算術(shù)平均數(shù)與加權(quán)算術(shù)平均數(shù)。算術(shù)平均數(shù)格式:AVERAGE,加權(quán)算術(shù)平均數(shù)(乘積和)格式:SUMPRODUCT
7 調(diào)和平均數(shù)(Harmonic mean)也叫調(diào)和均值,用 表示。它本質(zhì)上也是算術(shù)平均數(shù),只是表現(xiàn)形式不同。調(diào)和平均數(shù)格式:HARMEAN
例:三種蘋果,價(jià)格分別為5元、2.5元、2元。問:各買10元錢,混合后平均價(jià)格是多少?P422
8 幾何平均數(shù)(Geometic Mean),也稱幾何均值,用 表示。它是n個(gè)變量值乘積的n次方根。幾何平均數(shù)主要用于計(jì)算發(fā)展速度或增長比率的平均數(shù)函數(shù)。幾何平均數(shù)格式:GEOMEAN
9 眾數(shù)、中位數(shù)與算術(shù)平均數(shù)都是用來測度和說明數(shù)據(jù)的集中趨勢的,他們各有自己的特點(diǎn),應(yīng)用場合機(jī)所能說明的問題也不相同。
從數(shù)據(jù)分布來看,眾數(shù)是一組數(shù)據(jù)分布峰值位置的代表值,表明數(shù)據(jù)分布的“集中點(diǎn)”。它不受極端數(shù)值的影響,可以應(yīng)用于各種類型的數(shù)據(jù)。其缺點(diǎn)是不具有唯一性,對于一組數(shù)據(jù),可以有一個(gè)眾數(shù),也可能有多個(gè)眾數(shù),或者是沒有眾數(shù)。
中位數(shù)是位于一組數(shù)據(jù)排序后中間位置的值,是排序后數(shù)據(jù)的“中心”,表明兩邊各有一半數(shù)據(jù)。它同樣不受極端數(shù)值的影響,并且對于一組數(shù)據(jù)來講,中位數(shù)是唯一的。
算術(shù)平均數(shù)是全體數(shù)值的算術(shù)平均,是一組數(shù)據(jù)的“數(shù)量中心”,即各數(shù)值與平均數(shù)的離差和為0.它的缺點(diǎn)是容易受極端數(shù)值的影響。
通常情況下對于同一組數(shù)據(jù),三者間的關(guān)系表現(xiàn)為:若數(shù)據(jù)分布是單峰而且對稱,則三者相等;如果不對稱,當(dāng)分布左偏(負(fù)偏)時(shí),表明有偏小的極端值,此時(shí)算術(shù)平均數(shù)最小,中位數(shù)其次,眾數(shù)最大;當(dāng)分布右偏(正偏)時(shí),表明有偏大的極端值,此時(shí)眾數(shù)最小,中位數(shù)其次,算數(shù)平均值最大。
10 數(shù)據(jù)分布的特征:數(shù)據(jù)的集中趨勢和數(shù)據(jù)的離散程度。
11 極差(Range)也稱全距,用 表示,它是一組數(shù)據(jù)中最大值與最小值之差。極差是描述數(shù)據(jù)離散程度的最簡單的方法,表明數(shù)值得分布范圍。極差小,說明數(shù)據(jù)分布較集中;極差大,說明數(shù)據(jù)較分散。因?yàn)闃O差僅由兩個(gè)極端數(shù)值所決定,不能反映中間數(shù)據(jù)的分布離散裝況。
12 分位數(shù)常用的有四分位數(shù)(quaitile)、十分位數(shù)(decile)、百分位數(shù)(percentile)等。
13 四分位數(shù)也稱四分位點(diǎn),是用三個(gè)數(shù)值點(diǎn)把排序后的數(shù)據(jù)四等分,處在分位點(diǎn)的數(shù)據(jù)就是四分位數(shù)。格式:QUARTILE,在計(jì)算單元輸入函數(shù):“=QUARTILE(G2:G9,1)”,其中 “1”為四分位數(shù)中第1個(gè)四分位點(diǎn),“2”就是第2個(gè)四分位點(diǎn)。
14 四分位差(quartile deviation),也叫內(nèi)距或四分間距,它是上四分位數(shù)與下四分位數(shù)之差,用 表示: .四分位差可以表明中間50%的數(shù)據(jù)的離散程度。四分位差數(shù)值越小,說明中間數(shù)據(jù)分布越集中;相反,四分位差越大,表明中間部分?jǐn)?shù)值約分散,離散程度越大。
15 平均差(mean deviation)也叫平均離差,用 表示,它是各變量值與均值離差絕對值的平均數(shù)。平均差格式:AVEDEV,功能:計(jì)算指定區(qū)域內(nèi)所有數(shù)值的平均離差。
16 方差(variance)是一組數(shù)據(jù)中各變量與其均值離差平方的平均數(shù),方差的算術(shù)平方根叫標(biāo)準(zhǔn)差(standard deviation)。 方差與標(biāo)準(zhǔn)差是反映數(shù)值型數(shù)據(jù)離散程度的主要的也是常用的方法,是描述數(shù)據(jù)分布特征的重要的統(tǒng)計(jì)量。
17 偏度(skewness)是指數(shù)據(jù)分布的偏斜方向和程度,用偏度系數(shù) 表示。通常情況下,我們可以根據(jù)眾數(shù)、中位數(shù)和均值之間的關(guān)系,很容易地判斷出一組數(shù)據(jù)的分布是否對稱,是左偏還是右偏。格式:SKEW
18 峰度(kurtosis)是指數(shù)據(jù)分布集中趨勢高峰的形狀,它通常是與標(biāo)準(zhǔn)正態(tài)分布相比較而言的。若分布的形狀比標(biāo)準(zhǔn)正態(tài)分布更瘦更高,成為尖峰分布。相反,若更扁平,稱為平峰分布。