科学の箱

科学・IT・登山の話題

R

Rによるやさしい統計学/6-2つの平均値を比較する

投稿日:

(1) 統計が好きか嫌いかで統計テスト1の得点について有意な差はあるか。

指導法データは score.csvに作成する。

ID,名前,性別,数学,統計,心理学テスト,統計テスト1,統計テスト2,指導法
1,大村,男,嫌い,好き,13,6,10,C
2,本多,男,嫌い,好き,14,10,13,B
3,川崎,男,好き,好き,7,6,8,B
4,多村,男,好き,好き,12,10,15,A
5,松中,男,嫌い,嫌い,10,5,8,B
6,小久保,男,嫌い,嫌い,6,3,6,C
7,柴原,男,嫌い,嫌い,8,5,9,A

データを読み込む

> score <- read.csv(file="score.csv", head=TRUE)

2群からの平均値の比較であるので統計量はtとなる。ただし分散の等質性をを確認する。

> var.test(score[score$統計=="好き",7], score[score$統計=="嫌い",7])

        F test to compare two variances

data:  score[score$統計 == "好き", 7] and score[score$統計 == "嫌い", 7] 
F = 0.946, num df = 7, denom df = 11, p-value = 0.9781
alternative hypothesis: true ratio of variances is not equal to 1 
95 percent confidence interval:
 0.2516814 4.4550605 
sample estimates:
ratio of variances 
         0.9459792

帰無仮説は”母分散の比が1である”となる。対立仮説は”母分散の比は1ではない”

与えられたデータからF値は0.946となっている。自由度7/11におけるp値は0.9781となる。よって5%の有意水準では帰無仮説は棄却できない。つまり分散の等質性の仮定は満たされる。

データに対応はないために、対応がないt検定を行う。

 > t.test(score[score$統計=="好き",7], score[score$統計=="嫌い",7], var.equal=TRUE)

        Two Sample t-test

data:  score[score$統計 == "好き", 7] and score[score$統計 == "嫌い", 7] 
t = 2.1218, df = 18, p-value = 0.048
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 0.02250531 4.56082802 
sample estimates:
mean of x mean of y 
 8.375000  6.083333

データより統計量tは2.1218となる。自由度=18でp値は0.048となる。有意水準5%で帰無仮説は棄却される。よって統計が好きか嫌いかによって統計テスト1の結果に有意な差がある。

(2)性別により心理学テストの結果に有意な差があるか。

> var.test(score[score$性別=="男",6], score[score$性別=="女",6])

        F test to compare two variances

data:  score[score$性別 == "男", 6] and score[score$性別 == "女", 6] 
F = 1.5575, num df = 9, denom df = 9, p-value = 0.5196
alternative hypothesis: true ratio of variances is not equal to 1 
95 percent confidence interval:
 0.3868588 6.2704508 
sample estimates:
ratio of variances 
          1.557491

上記より分散の等質であるという帰無仮説が棄却されたのでWelchの検定を行う。

> t.test(score[score$性別=="男",6], score[score$性別=="女",6], var.equal=FALSE)

        Welch Two Sample t-test

data:  score[score$性別 == "男", 6] and score[score$性別 == "女", 6] 
t = 0.3836, df = 17.183, p-value = 0.706
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 -2.697454  3.897454 
sample estimates:
mean of x mean of y 
     10.3       9.7

p値は0.706となり、帰無仮説は棄却されない。よって有意な差があるとはいえない。

(3)ダイエットプログラムへの参加前後で体重に有意は変化が出ているかを調べる。

ダイエットデータはdiet.csvに作成する。

dietにdiet.csvを読み込む。

> diet <- read.csv(file="diet.csv", head=TRUE)
> head(diet)
  Before After
1     61    59
2     50    48
3     41    33
4     55    54
5     51    47
6     48    52

diet前後での比較なので個体は同じである。よって対応のあるt検定を実施する。

> t.test(diet$Before, diet$After, paired=TRUE)

        Paired t-test

data:  diet$Before and diet$After 
t = 2.8465, df = 9, p-value = 0.0192
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 0.6980082 6.1019918 
sample estimates:
mean of the differences 
                    3.4

t値は2.8465である。自由度9におけるpは0.0192となる。有意水準5%で帰無仮説は棄却される。よってダイエット前後で体重に変化はみられる。95%confidence intervalの区間は0.69~6.1となる。マイナスではないためにダイエットプログラムは効果があるといえる。

メタ情報

inarticle



メタ情報

inarticle



-R
-

執筆者:


  1. foo-bar-baz より:

    var.test や t.test は,
    var.test(統計テスト1 ~ 統計, data=score)
    t.test(統計テスト1 ~ 統計, data=score, var.equal=TRUE)
    などとする方が簡単ですし,分かりやすく,間違いが少ないと思います。
    また,read.csv は head=TRUE がデフォルトなので,省略することができます。

comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

factorと数値型の変換

ジニ係数にファクターと数値変換についてコメントをいただいたので調べてみた。 その結果以下の3つのことがわかった。 read.csvで桁区切り文字つきの値を読み込むとfactorになる。 区切り文字つき …

no image

ジニ係数

計量経済学の本を読んでいたら、ジニ係数の利用について記述されていたのでRで実データを使って計算してみる。 経済学の勉強でジニ係数というのは知っていたが、その利用方法としては所得の分配がどの程度平等であ …

no image

conjoint分析の資料

マニュアル conjointパッケージ caFactorialDesign Rでconjointパッケージを利用した例 Rでコンジョイント分析 Rでコンジョイント分析 |極めて個人的なメモ コンジョイ …

no image

データの縦・横展開

stack()関数を用いて横長のデータを縦長にできることを教わった。このようなデータ形式の変換はよくあることなのでもう少し調べてみた。 scoreデータは以下のような形式となっている。 > he …

no image

分散分析のcase study-2

分散分析のcase study-1からの続き。 さて前回まででとりあえずデータの簡単な分析を終えて、以下のような結論を得た。 図1よりR1とR2を比較するとスピードはR1のほうが常に上である。またS1 …

2014年5月
« 4月   6月 »
 1234
567891011
12131415161718
19202122232425
262728293031  

side bar top



アーカイブ

カテゴリー