さてoneway.test, aov, anovaの違いをもとにしてそれぞれの関数について調べてみる。
| 機能 | advantage | disadvantage | |
| oneway.test | 分散分析 | 等分散を仮定しないウェルチの分散分析 | 出力がいまいち |
| aov | 分散分析 | 出力結果を保存し別の関数を使って必要に応じて情報を得る | 等分散を仮定している。 |
| anova | lm()の結果から分散分析の結果を表示する | 等分散を仮定している |
oneway.testのメリットは等分散を仮定しないで分散分析を行える点である。oneway.testはデフォルトではウェルチの分散分析を実行する。分散の等質を前提にする時にはvar.equals=TRUEをパラメータで指定する。
oneway.testによるウェルチの分散分析については下記が詳しい。
No.12857 「welchの方法によるt検定」と「welchの分散分析」
しかしoneway.test()で出力される結果は下記のみで途中の計算結果を出力しない。そのため結果について疑問があるときに検証しにくい。
F = 4.515, num df = 3, denom df = 28, p-value = 0.01052
ただし途中結果の必要性については考慮する必要がある。余計なデータは、混乱を招く。
aov()は内部でlm()を実行して分散分析の結果を表示してくれる。分散分析を実施する際にはこの関数の利用数が一番多いように感じられる。aovと後述するanova+lmについての違いを質問している人もいるが回答を見るかぎり、機能としては同じようである。
anova()はlm()の結果から分散分析の結果を表示する。よく見かけるが線形回帰と分散分析は数学的には同じであるので、表示する内容を変えているだけといえる。
一般論では等分散を仮定するのは、現実的ではないというコメントをいただいた。等分散が一致することは考えにくいらしい。この場合には、等分散を仮定したt.test(…, var.equal=TRUE) 、 oneway.test(…, var.equal=TRUE) ,aov, anovaは不適切となる。
このあたりの議論について調べてみたところこの辺で記述されているっぽい。ちょっと難しいのでまた今度読んでみる。
あとt.test(…, var.equal=FALSE)が指定できるらしい。しかしt検定は等分散を仮定する。調べたところvar.equal=FALSEを指定するとウェルチの検定が実施される。