SPSS由IBM公司出品,它提供了包括描述性統(tǒng)計(jì)、推斷性統(tǒng)計(jì)、因子分析、聚類分析、回歸分析等多種統(tǒng)計(jì)分析功能,并包括文本分析、機(jī)器學(xué)習(xí)算法、數(shù)據(jù)分析模型等。SPSS的界面友好,易于操作,能夠快速?gòu)臄?shù)據(jù)中提取有用的洞察和分析,廣泛應(yīng)用于教育、心理、醫(yī)學(xué)、市場(chǎng)、人口、保險(xiǎn)等多個(gè)研究領(lǐng)域,也用于產(chǎn)品質(zhì)量控制、人事檔案管理和日常統(tǒng)計(jì)報(bào)表等。 回歸分析是數(shù)據(jù)處理中較為常用的一類方法,它可以找出數(shù)據(jù)變量之間的未知關(guān)系,得到較為符合變量關(guān)系的數(shù)學(xué)表達(dá)式,以幫助用戶完成數(shù)據(jù)分析。
接下來(lái)我們要介紹的就是回歸分析中的多元回歸分析方法,IBM SPSS Statistics為用戶提供了成熟的多元logistic回歸分析算法。
一、概述
1.數(shù)據(jù)
圖1:數(shù)據(jù)樣本
這是一份對(duì)不同人群早餐選擇的調(diào)查數(shù)據(jù),通過SPSS的多元回歸分析,可以將人群特征變量對(duì)早餐類型進(jìn)行分析,找到它們之間的關(guān)系。
2.功能位置
圖2:功能位置
在“分析”菜單下,我們可以找到“回歸”中的“多元logistic”分析,進(jìn)入多元回歸分析的窗口。
二、分析方法
1.因變量設(shè)置
圖3:因變量設(shè)置
因變量就是跟隨自變量變化的量,本例中指的是“首選的早餐”這一變量。
點(diǎn)擊“參考類別”,設(shè)置因變量的參考類別,這是分析時(shí)的參考樣,我們?cè)O(shè)置為所有類別都和最后一個(gè)類別對(duì)比,類別順序選擇升序。
2.因子和協(xié)變量
圖4:因子和協(xié)變量
因子可以簡(jiǎn)單理解為自變量,我們這里將年齡分段、婚姻狀況和生活方式作為因變量處理。
協(xié)變量是分析過程中需要控制的、對(duì)因變量有一定影響的控制變量,這里設(shè)置為性別。
3.分析模型
圖5:分析模型
SPSS的多元回歸分析有三類模型可選,主效應(yīng)是指設(shè)置好的因子和協(xié)變量與因變量之間的關(guān)系分析;全因子模型既包括主效應(yīng),也包括因子和協(xié)變量之間的交互分析;定制步進(jìn)式則可以有用戶自己定義分析類型。
我們這里選擇主效應(yīng)進(jìn)行分析即可。
4.統(tǒng)計(jì)設(shè)置
圖6:統(tǒng)計(jì)設(shè)置
這個(gè)窗口內(nèi)設(shè)置的是需要進(jìn)行的統(tǒng)計(jì)數(shù)據(jù)分析,包括多類統(tǒng)計(jì)數(shù)據(jù)可選,我們勾選模型下的偽R方、單元格可能性、步驟摘要、分類表、模型擬合度信息和擬合度,參數(shù)下的估計(jì)(置信區(qū)間設(shè)置為95%)和似然比檢驗(yàn)。
定義子群體選擇“由因子和協(xié)變量定義的協(xié)變量模式”。
5.收斂條件
圖7:收斂設(shè)置
在條件對(duì)話框中,進(jìn)行收斂設(shè)置。
最大迭代數(shù)是數(shù)據(jù)進(jìn)行回歸分析時(shí)可進(jìn)行迭代的次數(shù),這個(gè)數(shù)值必須是大于或小于100的整數(shù),最大步驟對(duì)分設(shè)置的是迭代時(shí)的等分?jǐn)?shù),系統(tǒng)默認(rèn)是5。
對(duì)數(shù)似然收斂可設(shè)置收斂值,回歸過程中對(duì)數(shù)似然比函數(shù)是大于設(shè)定值的;參數(shù)收斂的數(shù)值設(shè)置類似。
本例中該對(duì)話框保持默認(rèn)即可。
6.選項(xiàng)設(shè)置
圖8:選項(xiàng)設(shè)置
在選項(xiàng)對(duì)話框中設(shè)置離散度量為“無(wú)”。
數(shù)據(jù)的進(jìn)入概率為0.05,出去概率為0.1,這兩個(gè)參數(shù)中,前者越大,進(jìn)入模型的數(shù)據(jù)越多;后者越小,數(shù)據(jù)被剔除的越多,進(jìn)入和出去方法均選擇似然性。
其余保持默認(rèn)即可。
7.保存設(shè)置
圖9:保存設(shè)置
在這個(gè)對(duì)話框中設(shè)置需要保存的變量,如果需要將模型信息輸出到XML文件,也可以在次設(shè)置。
8.完成分析
圖10:結(jié)果輸出
完成上述設(shè)置后,就可以在日志輸出窗口中查看分析結(jié)果啦!分析結(jié)果包含多個(gè)表格,每個(gè)數(shù)值都有特定含義,大家在分析的時(shí)候也要認(rèn)真觀察數(shù)據(jù)哦!
三、小結(jié)
多元logistic回歸分析實(shí)質(zhì)上是二元logistic回歸分析的加和,在操作方法和結(jié)果分析上都有一定的相似之處,如果大家認(rèn)為多元回歸分析理解起來(lái)有困難,可以先學(xué)習(xí)一下IBM SPSS Statistics二元回歸分析的操作和分析。
世界上許多有影響的報(bào)刊雜志就SPSS給予了高度的評(píng)價(jià)。 |