這個假日去上課, 課中台中榮總的陳一銘醫師分享了醫學常用的統計, 這邊我把課程內的表格稍作改變(已徵得開課方同意), 再加上其他統計資料, 來做個整理!
首先是經典表格:
|
類別資料
|
無母數
|
有母數
|
兩組比
|
Chi-square
|
Mann-Whitney U
|
Independent t
|
多組比
|
Chi-square
|
Kruskal-Wallis
|
ANOVA
|
配對比
|
McNemar’s
|
Wilcoxon Singed rank
|
Paired t
|
相關性
|
Chi-square
|
Spearmen correlation
|
Regression & Pearson's correlation
|
表格裡面的類別資料指的是把資料分類,舉例來說我們想知道糖尿病比例在男女是否不同,這樣把性別分成男女,把糖尿病狀態分成有糖尿病比上沒有糖尿病,這樣就是類別資料做比較
再來是要簡單介紹一下何謂有母數(parametric), 一般來說在統計裡面, parametric 是指母體要符合某種預設的分布, 通常是常態分佈, 當然也有可能是其他分布, 不過至少在上面那張常用統計裡面, 有母數都是指分布要符合常態分布! 因為常見的醫學研究通常不可能會知道整個母體的資料, 因此都要進行抽樣, 抽出來進行分析的就是所謂樣本!
一般我們常說樣本要夠多, 其原因就是因為當樣本數非常多(一般說至少30人)的時候, 可以帶所謂的中央極限定理(central limit theorem), 這個時候當抽取非常多次樣本的時候, 其平均值的分布會接近常態分佈, 因此可以適用上面有母數的分析法
Reference:
1. https://www.ibm.com/support/knowledgecenter/zh-tw/SS6NHC/com.ibm.swg.im.dashdb.analytics.doc/doc/r_statistics.html