發布時間:2025-05-04 文章來源:xp下載站 瀏覽:
SPSS由IBM公司出品,它提供了包括描述性統計、推斷性統計、因子分析、聚類分析、回歸分析等多種統計分析功能,并包括文本分析、機器學習算法、數據分析模型等。SPSS的界面友好,易于操作,能夠快速從數據中提取有用的洞察和分析,廣泛應用于教育、心理、醫學、市場、人口、保險等多個研究領域,也用于產品質量控制、人事檔案管理和日常統計報表等。 我們通過散點圖研究發現,客流量與銷售額之間存在著正相關的關系,而客單價與銷售額之間似乎不存在相關關系。 為了進一步驗證客單價與銷售額之間的關系,同時衡量客流量與銷售額之間相關關系的程度,本文將會應用IBM SPSS Statistics的兩變量相關檢驗,探究客單價與銷售額、客流量與銷售額之間的密切程度。 一、使用的數據介紹 如圖1所示,本文使用的是一組包含客流量、銷售額、客單價的數據。
圖1:示例數據 二、應用雙變量相關檢驗 如圖2所示,依次單擊分析-相關-雙變量選項,打開雙變量相關分析面板。
圖2:雙變量相關 1. 選擇變量 在雙變量相關性設置面板中,首先,將要研究的變量添加到右側變量方框中。
圖3:選擇變量 2. 選項設置 然后,單擊選項按鈕,并在選項面板中勾選“平均值和標準差”的統計項。
圖4:選項設置 3. 相關系數與顯著性檢驗設置 接著,再進行相關系數與顯著性檢驗的設置。 如圖5所示,如果數據滿足正態分布的話,使用皮爾遜檢驗結果,否則就應該使用肯德爾或斯皮爾曼檢驗結果。由于我們仍未進行正態性檢驗,可以先把所有方法都勾選上。 另外,如果事先知道數據的分布,比如正相關、負相關等,選擇單尾檢驗,否則選擇雙尾檢驗。
圖5:相關系數與顯著性檢驗設置 4. 檢驗結果解讀 完成以上設置后,運行檢驗。 首先,從描述統計數值中,可以看到各個變量的平均值與標準差。
圖6:描述統計 在查看相關性檢驗時,需根據數據是否服從正態分布來選取不同的檢驗結果。如圖7所示,對數據應用KS檢驗來檢驗數據是否服從正態分布,從其漸進顯著性數值看到(均大于0.05),結果不顯著,也就是說不能拒絕數據服從正態分布的零和假設(因KS檢驗的零和假設是數據服從正態分布)。
圖7:KS檢驗 基于數據服從正態分布的前提,查看皮爾遜相關性檢驗結果。如圖8所示,客流量與銷售額的皮爾遜系數為0.92,標注了兩個星,說明客流量與銷售額相關性強;而客單價與銷售額的皮爾遜系數為0.342,也有較強的相關性。
圖8:相關性檢驗結果 三、小結 綜上所述,IBM SPSS Statistics的雙變量相關檢驗,可對兩變量間的相關關系進行程度性的測量,以探究兩兩變量間相關性的強弱。另外,結合使用散點圖,可對數據進行快速的相關性預判,輔助說明兩變量間的相關性。 世界上許多有影響的報刊雜志就SPSS給予了高度的評價。 |