oneway.test, aov, anovaの違い-2

投稿日：2014年5月19日

さてoneway.test, aov, anovaの違いをもとにしてそれぞれの関数について調べてみる。

	機能	advantage	disadvantage
oneway.test	分散分析	等分散を仮定しないウェルチの分散分析	出力がいまいち
aov	分散分析	出力結果を保存し別の関数を使って必要に応じて情報を得る	等分散を仮定している。
anova	lm()の結果から分散分析の結果を表示する		等分散を仮定している

oneway.testのメリットは等分散を仮定しないで分散分析を行える点である。oneway.testはデフォルトではウェルチの分散分析を実行する。分散の等質を前提にする時にはvar.equals=TRUEをパラメータで指定する。

oneway.testによるウェルチの分散分析については下記が詳しい。

No.12857　「welchの方法によるt検定」と「welchの分散分析」

しかしoneway.test()で出力される結果は下記のみで途中の計算結果を出力しない。そのため結果について疑問があるときに検証しにくい。

F = 4.515, num df = 3, denom df = 28, p-value = 0.01052

ただし途中結果の必要性については考慮する必要がある。余計なデータは、混乱を招く。

aov()は内部でlm()を実行して分散分析の結果を表示してくれる。分散分析を実施する際にはこの関数の利用数が一番多いように感じられる。aovと後述するanova+lmについての違いを質問している人もいるが回答を見るかぎり、機能としては同じようである。

anova()はlm()の結果から分散分析の結果を表示する。よく見かけるが線形回帰と分散分析は数学的には同じであるので、表示する内容を変えているだけといえる。

一般論では等分散を仮定するのは、現実的ではないというコメントをいただいた。等分散が一致することは考えにくいらしい。この場合には、等分散を仮定したt.test(…, var.equal=TRUE) 、 oneway.test(…, var.equal=TRUE) ，aov, anovaは不適切となる。

このあたりの議論について調べてみたところこの辺で記述されているっぽい。ちょっと難しいのでまた今度読んでみる。

あとt.test(…, var.equal=FALSE)が指定できるらしい。しかしt検定は等分散を仮定する。調べたところvar.equal=FALSEを指定するとウェルチの検定が実施される。

splineを利用する

factorと数値型の変換

findFn{sos}