読者です 読者をやめる 読者になる 読者になる

sonoshouのまじめなブログ

情報系大学生からのウェブ見習い人生の記録

検定のお話 Rによる実践

検定のお話 A君 VS B君
前回、後輩の卒論を見ていて検定していないことが気になったわけだけど、うっかり
検定を行わないと教授に指摘される。
なんて書いたもんだから、本当に指摘されてしまった。

検定については去年勉強したはずだったのだけれど、 今回検定して忘れかけてきていることがわかったので、再度まとめ直します。

検定手法

検定には、複数の検定手法があり、
どの検定手法を使うか検討する必要があります。

ノンパラメトリックテストには
1)独立2群の比較      Mann-Whitney U-test
2)独立3群以上の比較    Kruskal-Wallis test
3)対応のある2群の比較   Wilcoxon signed rank test
4)対応のある3群以上の比較 Friedman test

パラメトリックテストには
1)母集団の平均値との比較      One Sample t-test
2)対応のない2群の比較       Unpaired t-test
3)対応のある2群の比較       Paired t-test
4)一元配置分散分析(対応なし)   One-way Factorial ANOVA
5)一元配置分散分析(対応あり)   One-Way Repeated-Measures ANOVA
6)二元配置分散分析(対応のない因子と対応のない因子)Two-way Factorial ANOVA
7)二元配置分散分析(対応のある因子と対応のない因子)Two-way Repeated-Measures ANOVA
引用元:「分散分析」http://www.ibaraki-kodomo.com/toukei/anova.html

パラメトリック検定は、等分散性や正規性が過程されます。
従って、以下の場合はノンパラメトリック検定が推奨されます。

  • 標本数に極端な差がある
  • 等分散を仮定しない
  • 標本数が少ない

詳しくはwikipediaをご参照して下さい。

Rで検定メモ

Rとは、統計解析向けのソフトウェアです。
Wikipedia:R言語
研究室の先輩がRによる検定方法をまとめてくれたので、
そちらをご紹介します。
(お、俺も少し加筆したよ><;)

CSVファイルの読み込み 
data <- read.csv("C:\\Users\\test\\Desktop\\test.csv", header=FALSE)

・T検定 
パラメトリック検定.2群の標本に対して,有意差があるか検定する. 
t.test(data$V1, data$V2) 

・F検定 
-パラメトリック検定.2群の標本に対して,等分散性があるか検定する. 
(等分散検定.T検定の前提である等分散性を検定するためによく用いられる.) 
-パラメトリック検定.3群以上の標本に対して,有意差があるか検定する.(分散分析) 
var.test(data$V1, data$V2)

・マンホイットニーのU検定 
ノンパラメトリック検定.2群の標本に対して,有意差があるか検定する. 
wilcox.test(data$V1, data$V2) 

・Bartlett検定 
各群の分散が均一であるかどうか検定する. 
p < Alpha: 分散が均一でない 
分散が均一:ANOVA 
分散が均一でない:Kruskal-Wallis 
bartlett.test(data) 

・Kruskal-Wallis検定(kruskal.test) + 多重比較 
ノンパラメトリック検定.3群以上の標本に対して,それぞれ有意差があるか検定する. 
source("http://aoki2.si.gunma-u.ac.jp/R/src/kruskal_wallis.R", encoding="euc-jp") 
kruskal.wallis(data, group=NULL) 

以上です。
もっと詳しく説明したかったのですが、今日は時間がないのでこのへんで。
それでは良い検定ライフを。