在統計學中常見的rank test包括Wilcoxon rank-sum test(也稱為Mann-Whitney U test)和Wilcoxon signed-rank test。
獨立樣本 vs 配對樣本
在獨立樣本和配對樣本情況下,這兩種rank test的公式有所不同。
- 獨立樣本:在獨立樣本情況下,Wilcoxon rank-sum test使用的是兩個樣本的觀測值的秩次來進行計算,即將兩個樣本的數據合併後進行排序,然後計算每個觀測值的秩次,最後根據秩次之和的大小來進行假設檢驗。
- 配對樣本:而在配對樣本情況下,Wilcoxon signed-rank test使用的是兩個相關樣本的差值的絕對值的秩次來進行計算,即計算兩個相關樣本的差值的絕對值,然後對這些絕對值進行排序並計算秩次,最後根據秩次之和的大小進行假設檢驗。
因此,雖然兩者都是使用秩次(rank)來進行比較,但在獨立樣本和配對樣本情況下,其計算的具體方式是不同的。
所以一開始窩們要搞清楚,我們所用的到底是獨立樣本還是配對樣本,下面的例子剛好跟老師上課教得幾乎一樣
獨立樣本例子:
- 身高比較:
假設我們想比較男性和女性的平均身高是否存在統計上的差異。我們隨機選擇了 30 名男性和 30 名女性,並測量了他們的身高。
- 獨立樣本:男性組和女性組是獨立的,每組的身高資料是相互獨立的。
- 假設:我們想要測試的假設是男性和女性的平均身高是否存在差異。
配對樣本例子:
- 藥物效果測試:
假設我們正在研究一種新藥的效果,我們想知道這種藥是否能夠減輕患者的疼痛。我們隨機選擇了 20 名患有慢性疼痛的患者,對他們的疼痛程度進行評估(例如使用疼痛評分)。然後,我們給予他們這種新藥,再過一段時間後(例如一個月),我們再次對同一組患者的疼痛程度進行評估。
- 配對樣本:每位患者的疼痛評分是成對的,因為我們在給予新藥之前和之後都測量了他們的疼痛程度。
- 假設:我們想要測試的假設是在給予藥物之前和之後患者的平均疼痛程度是否有所改變。
使用公式
獨立樣本: Wilcoxon rank-sum test
rank大家會算吧(?),將其中之一樣樣本設為rank_sum令為W(基本上都取絕對值小的和),這個W的公式如下
配對樣本: Wilcoxon signed-rank test
接著用中央極限定理解題
實例: Wilcoxon rank-sum test
假設你是一位心理學家,想要研究兩種不同的學習方法對於考試成績的影響。你隨機選取了兩組學生,一組採用方法 A 進行學習,另一組採用方法 B 進行學習。在一次考試後,你記錄了每組學生的成績。現在,你想知道這兩種學習方法是否對於成績有顯著的影響。
以下是每組學生的成績數據:
- 方法 A: 78, 85, 72, 90, 88
- 方法 B: 60, 68, 75, 80, 70
現在,你想使用 Wilcoxon rank-sum test 來比較這兩組學習方法的成績。
進行 Wilcoxon rank-sum test 的步驟如下:
步驟 1: 計算 rank sum
首先,將兩組數據合併後進行排序,並計算每個觀測值的秩次。假設若有相同的數值,則對應的秩次取平均值。
- 方法 A: 72 (3), 78 (4), 85 (5), 88 (6), 90 (7)
- 方法 B: 60 (1), 68 (2), 70 (8), 75 (9), 80 (10)
步驟 2: 計算 rank sum
將每組的秩次相加以得到 rank sum。
- 方法 A 的 rank sum ( W_A = 3 + 4 + 5 + 6 + 7 = 25 )
- 方法 B 的 rank sum ( W_B = 1 + 2 + 8 + 9 + 10 = 30 )
步驟 3: 準備Z檢定
步驟 4: 進行Z檢定
於是我們不reject H0,我們沒有足夠的證據來支持一種學習方法優於另一種學習方法
anova(變異數分析)
符號定義
定義總變異量TSS
可以化簡成WSS(組內變異)與+ASS(組間變異)