科学の箱

科学・IT・登山の話題

R

oneway.test, aov, anovaの違い-2

投稿日:

さてoneway.test, aov, anovaの違いをもとにしてそれぞれの関数について調べてみる。

機能 advantage disadvantage
oneway.test 分散分析 等分散を仮定しないウェルチの分散分析 出力がいまいち
aov 分散分析 出力結果を保存し別の関数を使って必要に応じて情報を得る 等分散を仮定している。
anova lm()の結果から分散分析の結果を表示する  等分散を仮定している

oneway.testのメリットは等分散を仮定しないで分散分析を行える点である。oneway.testはデフォルトではウェルチの分散分析を実行する。分散の等質を前提にする時にはvar.equals=TRUEをパラメータで指定する。

oneway.testによるウェルチの分散分析については下記が詳しい。

No.12857 「welchの方法によるt検定」と「welchの分散分析」

しかしoneway.test()で出力される結果は下記のみで途中の計算結果を出力しない。そのため結果について疑問があるときに検証しにくい。

F = 4.515, num df = 3, denom df = 28, p-value = 0.01052

ただし途中結果の必要性については考慮する必要がある。余計なデータは、混乱を招く。

aov()は内部でlm()を実行して分散分析の結果を表示してくれる。分散分析を実施する際にはこの関数の利用数が一番多いように感じられる。aovと後述するanova+lmについての違いを質問している人もいるが回答を見るかぎり、機能としては同じようである。

anova()はlm()の結果から分散分析の結果を表示する。よく見かけるが線形回帰と分散分析は数学的には同じであるので、表示する内容を変えているだけといえる。

一般論では等分散を仮定するのは、現実的ではないというコメントをいただいた。等分散が一致することは考えにくいらしい。この場合には、等分散を仮定したt.test(…, var.equal=TRUE) 、 oneway.test(…, var.equal=TRUE) ,aov, anovaは不適切となる。

このあたりの議論について調べてみたところこの辺で記述されているっぽい。ちょっと難しいのでまた今度読んでみる。

あとt.test(…, var.equal=FALSE)が指定できるらしい。しかしt検定は等分散を仮定する。調べたところvar.equal=FALSEを指定するとウェルチの検定が実施される。

 

メタ情報

inarticle



メタ情報

inarticle



-R
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

因子分析

因子分析とは 因子分析では複雑な現象を単純な要因で理解するための手法。集められた個別のデータは結果である目的変数とその目的変数の原因である説明変数に分かれる。目的変数を観察できた結果とし、目的変数に影 …

no image

大気汚染データの観測

コーセラのDeveloping Data Productで知りたい場所の緯度経度を入力すると過去の観測データからオゾン濃度とPM25汚染濃度を予測するコードを紹介していた。Video Lectureの …

no image

tracertの分析

tracertを繰り返し実行した結果を分析し、経路上のホストについてどの程度時間がかかっているかを分析してみる。 tracertの結果は以下のように取得される。 $ tracert www.googl …

no image

ジニ係数

計量経済学の本を読んでいたら、ジニ係数の利用について記述されていたのでRで実データを使って計算してみる。 経済学の勉強でジニ係数というのは知っていたが、その利用方法としては所得の分配がどの程度平等であ …

no image

主成分分析

Rで提供されているirisを使って主成分分析を実施する。 主成分分析の手順 データが分離できるか検証する 主成分負荷量と寄与率を求める 新しい変数に名前を付ける 変量プロット 主成分プロット 今回はR …

2014年5月
« 4月   6月 »
 1234
567891011
12131415161718
19202122232425
262728293031  

side bar top



アーカイブ

カテゴリー