SPSS由IBM公司出品,它提供了包括描述性統(tǒng)計(jì)、推斷性統(tǒng)計(jì)、因子分析、聚類分析、回歸分析等多種統(tǒng)計(jì)分析功能,并包括文本分析、機(jī)器學(xué)習(xí)算法、數(shù)據(jù)分析模型等。SPSS的界面友好,易于操作,能夠快速?gòu)臄?shù)據(jù)中提取有用的洞察和分析,廣泛應(yīng)用于教育、心理、醫(yī)學(xué)、市場(chǎng)、人口、保險(xiǎn)等多個(gè)研究領(lǐng)域,也用于產(chǎn)品質(zhì)量控制、人事檔案管理和日常統(tǒng)計(jì)報(bào)表等。 IBM SPSS Statistics的二項(xiàng)分布檢驗(yàn),屬于非參數(shù)檢驗(yàn)中的一種分析方法,與參數(shù)檢驗(yàn)不同,非參數(shù)檢驗(yàn)是在總體方差未知的情況下,利用樣本數(shù)據(jù)對(duì)總體分布等進(jìn)行推斷分析的方法。
而二項(xiàng)分布檢驗(yàn)是用于二值取值樣本數(shù)據(jù)的檢驗(yàn)方法,通過驗(yàn)證樣本數(shù)據(jù)是否服從概率為P的二項(xiàng)分布來推斷樣本所屬總體是否符合概率為P的二項(xiàng)分布。接下來,我們會(huì)以一個(gè)檢驗(yàn)產(chǎn)品合格率是否符合指定合格率的事例作為例子。
一、使用的數(shù)據(jù)類型
由于二項(xiàng)分布檢驗(yàn)是用于二值取值的檢驗(yàn)方法,在分析數(shù)據(jù)時(shí),如圖1所示,需使用數(shù)值型的數(shù)據(jù)。

圖1:示例數(shù)據(jù)
為了更好地識(shí)別變量中數(shù)值的含義,如圖2所示,可以在變量的值標(biāo)簽中,標(biāo)注數(shù)值的值標(biāo)簽。在本例中,分別使用1、0代表合格、不合格。
圖2:變量值標(biāo)簽
二、應(yīng)用二項(xiàng)分布檢驗(yàn)
了解了二項(xiàng)分布使用的數(shù)據(jù)類型后,就可以打開IBM SPSS Statistics的二項(xiàng)分布檢驗(yàn)功能,進(jìn)一步了解其使用的方法。
如圖3所示,依次單擊分析-非參數(shù)檢驗(yàn)-舊對(duì)話框-二項(xiàng)檢驗(yàn),打開二項(xiàng)檢驗(yàn)的設(shè)置面板。

圖3:二項(xiàng)分布檢驗(yàn)
先簡(jiǎn)單了解一下二項(xiàng)檢驗(yàn)中的選項(xiàng)含義:
1. 檢驗(yàn)變量列表,即用于二項(xiàng)檢驗(yàn)的變量
2. 定義二分法,用于定義二值的取值。如數(shù)據(jù)僅包含二值,可選擇“從數(shù)據(jù)中獲取”;如數(shù)據(jù)包含多個(gè)值,就需要設(shè)置“分割點(diǎn)”,將數(shù)據(jù)分為兩組取值
3. 檢驗(yàn)比例,即用于驗(yàn)證數(shù)據(jù)是否服從的概率P
接下來,我們使用示例數(shù)據(jù)實(shí)際操作一下。

圖4:二項(xiàng)分布設(shè)置面板
1.選擇變量
本例中檢驗(yàn)的是抽樣產(chǎn)品的合格率是否符合98%的標(biāo)準(zhǔn),按照該檢驗(yàn)?zāi)康模鐖D5所示,需將“是否合格”變量添加為檢驗(yàn)變量列表,設(shè)置“從數(shù)據(jù)中獲取”的方法,并將檢驗(yàn)比例設(shè)置為“0.98”。

圖5:選擇變量
2.精確檢驗(yàn)
由于二項(xiàng)分布屬于非參數(shù)檢驗(yàn),需要進(jìn)行精確檢驗(yàn)的設(shè)置。一般情況下,保持默認(rèn)的“僅漸進(jìn)法”選項(xiàng)。蒙特卡洛法、精確法用于總體非漸進(jìn)分布的情況。

圖6:精確檢驗(yàn)
3.選項(xiàng)設(shè)置
接著,設(shè)置統(tǒng)計(jì)數(shù)值以及缺失值的處理方法。為了更全面地分析數(shù)據(jù),可同時(shí)勾選“描述”與“四分位數(shù)”。

圖7:配對(duì)樣本T檢驗(yàn)的數(shù)據(jù)格式
4.結(jié)果解讀
完成以上設(shè)置后,運(yùn)行檢驗(yàn)。
如圖8所示,可以看到,樣本的合格率為95%,與檢驗(yàn)比例98%相比較,其顯著性為0.02<0.05,表明當(dāng)前樣本的合格率與檢驗(yàn)比例有顯著差異,也就是說,當(dāng)前樣本的合格率不符合標(biāo)準(zhǔn)。
圖8:檢驗(yàn)結(jié)果不顯著
三、小結(jié)
綜上所述,IBM SPSS Statistics的二項(xiàng)分布檢驗(yàn),是一種非參數(shù)的檢驗(yàn)方法,用于推斷樣本所屬總體是否符合概率為P的分布,適用于分析二值取值變量數(shù)據(jù)是否符合標(biāo)準(zhǔn)概率的情況。
世界上許多有影響的報(bào)刊雜志就SPSS給予了高度的評(píng)價(jià)。 |