SPSS由IBM公司出品,它提供了包括描述性統(tǒng)計、推斷性統(tǒng)計、因子分析、聚類分析、回歸分析等多種統(tǒng)計分析功能,并包括文本分析、機器學(xué)習(xí)算法、數(shù)據(jù)分析模型等。SPSS的界面友好,易于操作,能夠快速從數(shù)據(jù)中提取有用的洞察和分析,廣泛應(yīng)用于教育、心理、醫(yī)學(xué)、市場、人口、保險等多個研究領(lǐng)域,也用于產(chǎn)品質(zhì)量控制、人事檔案管理和日常統(tǒng)計報表等。 在存在多個數(shù)據(jù)源的情況下,經(jīng)常會使用到IBM SPSS Statistics的數(shù)據(jù)合并功能,對多個數(shù)據(jù)源的數(shù)據(jù)進行合并。
比如在收集地區(qū)數(shù)據(jù)時,需要不同地區(qū)的人員分開收集,而在數(shù)據(jù)匯總的階段,就需要使用到數(shù)據(jù)合并的功能將這些不同來源的數(shù)據(jù)合并匯總。本節(jié),我們將會重點學(xué)習(xí)變量的合并。
一、打開需合并的數(shù)據(jù)
變量合并的作用是將不同數(shù)據(jù)文件中,相同個案的不同變量數(shù)據(jù)進行合并。比如數(shù)據(jù)A包含了年齡、性別等數(shù)據(jù),而數(shù)據(jù)B包含了地區(qū)、收入等數(shù)據(jù),而這些數(shù)據(jù)都是來自同一批個案,就可以通過變量合并數(shù)據(jù)。
首先,在SPSS中分別打開兩個需要合并的數(shù)據(jù)文件。

圖1:打開數(shù)據(jù)
如圖2所示,可以看到,兩個數(shù)據(jù)文件中存在著賬號、性別、客單價三個相同變量,以及Area、地區(qū)、來源、點擊頁面數(shù)四個不同變量,其中地區(qū)與Area實際為同一個變量,但命名方式不同。

圖2:對比變量差異
二、使用變量合并功能
接著,如圖3所示,依次打開數(shù)據(jù)-合并文件-添加變量,針對數(shù)據(jù)文件的異同點進行變量合并。

圖3:變量合并功能
由于當(dāng)前打開的是數(shù)據(jù)集2,因此最終的數(shù)據(jù)會合并到數(shù)據(jù)集2中。如圖4所示,以數(shù)據(jù)集2為基礎(chǔ),與之前已打開的數(shù)據(jù)集3進行合并。

圖4:指定合并的數(shù)據(jù)文件
接著,如圖5所示,打開變量選項卡,進行變量合并的設(shè)置。
其中,變量括號中含+的是數(shù)據(jù)集2中不包含的變量,而含*的是數(shù)據(jù)集2中包含的變量。設(shè)置的變量含義如下:
排除的變量,即兩個數(shù)據(jù)文件中存在差異的,但在合并數(shù)據(jù)過程中需要剔除的變量。
包含的變量,即兩個數(shù)據(jù)文件中存在差異的,但在合并數(shù)據(jù)過程中需要保留的變量。
鍵變量,即兩個數(shù)據(jù)文件同時包含的變量。

圖5:設(shè)置變量的合并方式
由于變量“地區(qū)”與“Area”實際為同一變量,可將其中一個添加為“包含的變量”,另外,還可以通過重命名的方法,將“Area”重命名為“地區(qū)”。

圖6:重命名變量
如圖6所示,可以看到“Area”已重命名為“地區(qū)”,將其添加為“包含的變量”。

圖7:完成變量的重命名
如圖7所示,在包含的變量中,“Area”變量已經(jīng)重命名為“地區(qū)”變量。當(dāng)然,我們也可以直接使用數(shù)據(jù)集2中包含的“地區(qū)”變量。

圖8:添加重命名后的變量
完成以上操作后,如圖8所示,可以看到,變量已經(jīng)合并完成。后續(xù),可對數(shù)據(jù)作進一步的整理,如排序等。

圖9:完成變量的合并
世界上許多有影響的報刊雜志就SPSS給予了高度的評價。 |