SPSS由IBM公司出品,它提供了包括描述性統(tǒng)計(jì)、推斷性統(tǒng)計(jì)、因子分析、聚類分析、回歸分析等多種統(tǒng)計(jì)分析功能,并包括文本分析、機(jī)器學(xué)習(xí)算法、數(shù)據(jù)分析模型等。SPSS的界面友好,易于操作,能夠快速?gòu)臄?shù)據(jù)中提取有用的洞察和分析,廣泛應(yīng)用于教育、心理、醫(yī)學(xué)、市場(chǎng)、人口、保險(xiǎn)等多個(gè)研究領(lǐng)域,也用于產(chǎn)品質(zhì)量控制、人事檔案管理和日常統(tǒng)計(jì)報(bào)表等。 神經(jīng)網(wǎng)絡(luò)是基于模仿生物大腦結(jié)構(gòu)及功能的信息處理系統(tǒng),可通過(guò)各種算法從數(shù)據(jù)中學(xué)習(xí)如何完成任務(wù),在模式識(shí)別、人工智能、預(yù)測(cè)、醫(yī)學(xué)等領(lǐng)域擁有廣闊的發(fā)展前景。
在本文中,會(huì)通過(guò)神經(jīng)網(wǎng)絡(luò)中的經(jīng)典例子鳶尾花,講解如何利用IBM SPSS Statistics實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)處理和模型訓(xùn)練,從而得到相應(yīng)的神經(jīng)網(wǎng)絡(luò)模型。
一、數(shù)據(jù)的標(biāo)準(zhǔn)化處理
在實(shí)際場(chǎng)景中應(yīng)用神經(jīng)網(wǎng)絡(luò)方法時(shí),通常需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,以此消除數(shù)據(jù)之間的量綱差異,讓后續(xù)的數(shù)據(jù)使用更加方便。
本文使用的是一組包含三種類型的鳶尾花數(shù)據(jù),擁有四個(gè)指標(biāo),目的是通過(guò)四個(gè)指標(biāo)對(duì)鳶尾花的類型進(jìn)行預(yù)測(cè)。
圖1:示例數(shù)據(jù)
首先,如圖2所示,在分析菜單中打開描述功能。
圖2:描述功能
如圖3所示,選中“將標(biāo)準(zhǔn)化值另存為變量”,點(diǎn)擊確定。
圖3:標(biāo)準(zhǔn)化值另存為變量
最終得到標(biāo)準(zhǔn)化的數(shù)據(jù),如圖4所示。
圖4:標(biāo)準(zhǔn)化數(shù)值
二、神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)
首先需要生成一個(gè)分組變量,將70%的樣本數(shù)據(jù)用于訓(xùn)練。如圖5所示,選擇數(shù)據(jù)菜單中的計(jì)算變量功能,設(shè)置目標(biāo)變量“分組”,使用數(shù)字表達(dá)式對(duì)變量分組。
圖5:變量分組
如圖6,在分析菜單中選中神經(jīng)網(wǎng)絡(luò),打開多層感知器功能。
圖6:多層感知器功能
接下來(lái)在功能面板中設(shè)置各項(xiàng)參數(shù),如圖7所示,在變量分區(qū)中設(shè)置因變量和因子。
圖7:設(shè)置參數(shù)
點(diǎn)擊分區(qū),如圖8所示,選擇已生成的分組變量。
圖8:分區(qū)變量選擇
再點(diǎn)擊輸出,選擇圖9中被選中的選項(xiàng)。
圖9:輸出選項(xiàng)
最后點(diǎn)擊保存,如圖10所示,選擇圖中的兩個(gè)選項(xiàng),然后點(diǎn)擊確定。最終可得到這組數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)模型及訓(xùn)練結(jié)果。
圖10:保存
世界上許多有影響的報(bào)刊雜志就SPSS給予了高度的評(píng)價(jià)。 |