在AI,paired comparisons(配對比較)常用於比較不同算法或模型的性能。像是當我們有幾種不同的機器學習算法時,可以將它們分別應用於相同的數據集,然後使用配對比較來比較它們的表現。這有助於確定哪種算法更適合解決特定的問題,或者哪種算法的性能更好。通過配對比較,我們可以在相同的條件下進行公平的比較,從而更準確地評估各種算法的優劣
前言
首先,我們要先搞清楚我們的目的,以這篇文章所舉的所有例子中,都是為了判斷分布是否一樣(H0: mu1 = mu2),以抽菸12小時和24小時的尼古丁殘量兩組資料為例,如果分布結果一樣(不reject H0),那麼我們就可以說其實過了12小時和24小時尼古丁殘量都沒差
前處理
那首先,當然我們要把資料混和,並搞清楚它的等級(rank),下圖是假設有A,B兩組資料的混和狀況,混以最小的數字為rank1,如果有一樣的,則取平均
實例
我們接著要直接測試高濃度本童尿症的兒童和低濃度的比較,先標上他們的等級,接著設定左邊的ranksum為W。運用中央極限定理(CLT),假設左邊的樣本數為n,右邊為m,為了方便,直接當作n, m趨近於無限大,則:
所以兩組數據可視為一致