科学の箱

科学・IT・登山の話題

R

Rによるやさしい統計学/7-分散分析

投稿日:

(1)学部によりテストの結果に有意な差があるかを調べる。

データはcsv形式で作成し、7_1_test_score.csvとする。以下はデータの内容。

法学部,文学部,理学部,工学部
75,62,65,52
61,60,60,59
68,66,78,44
58,63,52,67
66,55,59,47
55,53,66,53
65,59,73,58
63,63,64,49

Rに読み込む

score <- read.csv(file="7_1_test_score.csv", head=TRUE)

分散分析で利用するためにデータを変換する。

w_score$point <- c(score[,1], score[,2], score[,3], score[,4])
w_score$major <- c(rep("j", 8), rep("l", 8), rep("s",8), rep("i",8))
w_score$major <- factor(w_score$major)

変換したデータについて確認する

> w_score$point
 [1] 75 61 68 58 66 55 65 63 62 60 66 63 55 53 59 63 65 60 78 52 59 66 73 64 52 59 44 67 47 53
[31] 58 49
> w_score$major
 [1] j j j j j j j j l l l l l l l l s s s s s s s s i i i i i i i i
Levels: i j l s

帰無仮説は学部によりテストのポイントに差はない。対立仮説は一つ以上の組み合わせで学部によりテストのポイントに差があるとする。

oneway.testを利用した1要因の分散分析を実行する。

> oneway.test(w_score$point ~ w_score$major, var.equal=TRUE)

        One-way analysis of means

data:  w_score$point and w_score$major 
F = 4.515, num df = 3, denom df = 28, p-value = 0.01052

ここでは分散が等質であることを仮定している。F値は4.515となった。自由度3/28であるときのp値は0.01052である。有意水準5%で帰無仮説が棄却される。よってテストのポイントは学部によって差がある。

aov()を使用してみる。

> w_score$aov<-aov(w_score$point ~ w_score$major)
> summary(w_score$aov)
              Df Sum Sq Mean Sq F value Pr(>F)  
w_score$major  3  606.4  202.12   4.515 0.0105 *
Residuals     28 1253.5   44.77

anova()を利用してみる

> w_score$anova <- anova(lm(w_score$point ~ w_score$major))
> w_score$anova
Analysis of Variance Table

Response: w_score$point
              Df  Sum Sq Mean Sq F value  Pr(>F)  
w_score$major  3  606.37 202.125   4.515 0.01052 *
Residuals     28 1253.50  44.768                  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’

メタ情報

inarticle



メタ情報

inarticle



-R
-

執筆者:


  1. foo-bar-baz より:

    データの準備は,
    score2 <- stack(score)
    score2
    とすると,簡単です。

  2. admin より:

    ありがとうございます!こんな便利な関数があったのですね。

foo-bar-baz へ返信する コメントをキャンセル

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

factorと数値型の変換-2

factorと数値型の変換でとりあえず区切り文字付き数字の変換方法についてめどは立ったが、そもそも区切り文字付き数字がなぜfactorになるのかがわからない。文字列にするにはパラメータを指定する必要が …

no image

Rによるやさしい統計学/5-統計的検定-2

練習問題-2 勉強時間と定期試験の点数についてデータを作成する。 study_time <- c(1, 3, 10, 12, 6, 3, 8, 4, 1, 5) point <- c(20 …

no image

分散分析のcase study-2

分散分析のcase study-1からの続き。 さて前回まででとりあえずデータの簡単な分析を終えて、以下のような結論を得た。 図1よりR1とR2を比較するとスピードはR1のほうが常に上である。またS1 …

no image

cexについてまとめる

Rでグラフィックのパラメータはpar()で指定する。par()のパラメータを変更することでplotなどの表示方法を柔軟に変更できる。例えばラベルのフォントの大きさなどである。下記はpar()で指定でき …

no image

Rによるやさしい統計学/4-母集団と標本

言葉の定義 推測統計、推定、点推定、区間推定、検定 標本、標本統計量、推定量、標本抽出、確率変数、確率分布、標本誤差 標本分布、標本統計量、平均、標準偏差、標準誤差 4.5 標本分布 標本平均の標本分 …

2014年5月
« 4月   6月 »
 1234
567891011
12131415161718
19202122232425
262728293031  

side bar top



アーカイブ

カテゴリー