SPSS由IBM公司出品,它提供了包括描述性統(tǒng)計(jì)、推斷性統(tǒng)計(jì)、因子分析、聚類分析、回歸分析等多種統(tǒng)計(jì)分析功能,并包括文本分析、機(jī)器學(xué)習(xí)算法、數(shù)據(jù)分析模型等。SPSS的界面友好,易于操作,能夠快速從數(shù)據(jù)中提取有用的洞察和分析,廣泛應(yīng)用于教育、心理、醫(yī)學(xué)、市場、人口、保險(xiǎn)等多個(gè)研究領(lǐng)域,也用于產(chǎn)品質(zhì)量控制、人事檔案管理和日常統(tǒng)計(jì)報(bào)表等。 IBM SPSS Statistics探索性分析提供了數(shù)據(jù)過濾、離群值識別、假設(shè)檢驗(yàn)等分析功能。在《應(yīng)用SPSS探索性分析,快速檢查數(shù)據(jù)異常值》一文中,我們應(yīng)用探索性分析檢查到數(shù)據(jù)中存在著極端值的情況。本節(jié),將會繼續(xù)應(yīng)用檢驗(yàn)功能檢查數(shù)據(jù)的正態(tài)分布情況。
一、圖分析功能簡介
如圖1所示,IBM SPSS Statistics探索性分析中的圖功能包含了圖表的可視化以及正態(tài)性檢驗(yàn),簡單介紹如下:
1.箱圖,以最大值、最小值、中位數(shù)和兩個(gè)四分位數(shù)描述數(shù)據(jù),可檢查數(shù)據(jù)的對稱性與分散程度。
2.描述性,包含莖葉圖和直方圖。
3.帶檢驗(yàn)的正態(tài)圖,包含正態(tài)性檢驗(yàn)以及正態(tài)Q-Q圖。
4.含萊文檢驗(yàn)的分布-水平圖,控制分布-水平圖的數(shù)據(jù)轉(zhuǎn)換。
接下來,我們將簡單應(yīng)用以上功能到本文的例子中,用以檢驗(yàn)不同性別的客單價(jià)數(shù)據(jù)是否符合正態(tài)分布。

圖1:圖分析功能
二、應(yīng)用圖分析功能
1、設(shè)置圖分析選項(xiàng)
如圖2所示,分別勾選“直方圖”以及“含檢驗(yàn)的正態(tài)圖”兩個(gè)選項(xiàng),然后單擊“繼續(xù)”,獲取分析結(jié)果。

圖2:圖分析選項(xiàng)
2、解讀圖分析結(jié)果
首先,我們來看一下正態(tài)性檢驗(yàn)的數(shù)值。如圖3所示,可以看到,男性客單價(jià)在兩種檢驗(yàn)中均低于0.05的置信度,因此可以拒絕其正態(tài)分布的假設(shè)。
而女性客單價(jià)在柯爾莫哥洛夫-斯米諾夫檢驗(yàn)(K-S檢驗(yàn))中高于0.05的置信度,在夏皮洛-威爾克檢驗(yàn)(S-W檢驗(yàn))中低于0.05的置信度,因本例女性只有49個(gè)樣本,屬于小樣本,要采用S-W檢驗(yàn)結(jié)果,即拒絕其正態(tài)分布的假設(shè)。

圖3:正態(tài)性檢驗(yàn)
除了使用正態(tài)性檢驗(yàn)數(shù)據(jù),我們還可以通過正態(tài)Q-Q圖,簡單看一下不同性別客單價(jià)的實(shí)測值與期望正態(tài)值的關(guān)系。當(dāng)數(shù)值分布于正態(tài)曲線上,表明變量符合正態(tài)分布。
如圖4所示,可以看到,男性的客單價(jià)偏離正態(tài)曲線,不符合正態(tài)分布。

圖4:男性客單價(jià)正態(tài)Q-Q圖
如圖5所示,女性的數(shù)值雖然都接近于正態(tài)曲線,但也有一些離散的值,如果樣本量大一點(diǎn),可能效果會更好一點(diǎn)。

圖5:女性客單價(jià)正態(tài)Q-Q圖
然后,如圖5所示,選中已添加的地區(qū)變量,在新名詞處輸入重新編碼后的變量名稱:地區(qū)編碼,并將其添加為新名稱。
圖6:女性客單價(jià)直方圖
世界上許多有影響的報(bào)刊雜志就SPSS給予了高度的評價(jià)。 |