發布時間:2025-05-04 文章來源:xp下載站 瀏覽:
SPSS由IBM公司出品,它提供了包括描述性統計、推斷性統計、因子分析、聚類分析、回歸分析等多種統計分析功能,并包括文本分析、機器學習算法、數據分析模型等。SPSS的界面友好,易于操作,能夠快速從數據中提取有用的洞察和分析,廣泛應用于教育、心理、醫學、市場、人口、保險等多個研究領域,也用于產品質量控制、人事檔案管理和日常統計報表等。 IBM SPSS Statistics探索性分析提供了數據過濾、離群值識別、假設檢驗等分析功能。在《應用SPSS探索性分析,快速檢查數據異常值》一文中,我們應用探索性分析檢查到數據中存在著極端值的情況。本節,將會繼續應用檢驗功能檢查數據的正態分布情況。 一、圖分析功能簡介 如圖1所示,IBM SPSS Statistics探索性分析中的圖功能包含了圖表的可視化以及正態性檢驗,簡單介紹如下: 1.箱圖,以最大值、最小值、中位數和兩個四分位數描述數據,可檢查數據的對稱性與分散程度。 2.描述性,包含莖葉圖和直方圖。 3.帶檢驗的正態圖,包含正態性檢驗以及正態Q-Q圖。 4.含萊文檢驗的分布-水平圖,控制分布-水平圖的數據轉換。 接下來,我們將簡單應用以上功能到本文的例子中,用以檢驗不同性別的客單價數據是否符合正態分布。 圖1:圖分析功能 二、應用圖分析功能 1、設置圖分析選項 如圖2所示,分別勾選“直方圖”以及“含檢驗的正態圖”兩個選項,然后單擊“繼續”,獲取分析結果。 圖2:圖分析選項 2、解讀圖分析結果 首先,我們來看一下正態性檢驗的數值。如圖3所示,可以看到,男性客單價在兩種檢驗中均低于0.05的置信度,因此可以拒絕其正態分布的假設。 而女性客單價在柯爾莫哥洛夫-斯米諾夫檢驗(K-S檢驗)中高于0.05的置信度,在夏皮洛-威爾克檢驗(S-W檢驗)中低于0.05的置信度,因本例女性只有49個樣本,屬于小樣本,要采用S-W檢驗結果,即拒絕其正態分布的假設。 圖3:正態性檢驗 除了使用正態性檢驗數據,我們還可以通過正態Q-Q圖,簡單看一下不同性別客單價的實測值與期望正態值的關系。當數值分布于正態曲線上,表明變量符合正態分布。 如圖4所示,可以看到,男性的客單價偏離正態曲線,不符合正態分布。 圖4:男性客單價正態Q-Q圖 如圖5所示,女性的數值雖然都接近于正態曲線,但也有一些離散的值,如果樣本量大一點,可能效果會更好一點。 圖5:女性客單價正態Q-Q圖 然后,如圖5所示,選中已添加的地區變量,在新名詞處輸入重新編碼后的變量名稱:地區編碼,并將其添加為新名稱。
世界上許多有影響的報刊雜志就SPSS給予了高度的評價。 |