科学の箱

科学・IT・登山の話題

R

Rによるやさしい統計学/6-2つの平均値を比較する

投稿日:

(1) 統計が好きか嫌いかで統計テスト1の得点について有意な差はあるか。

指導法データは score.csvに作成する。

ID,名前,性別,数学,統計,心理学テスト,統計テスト1,統計テスト2,指導法
1,大村,男,嫌い,好き,13,6,10,C
2,本多,男,嫌い,好き,14,10,13,B
3,川崎,男,好き,好き,7,6,8,B
4,多村,男,好き,好き,12,10,15,A
5,松中,男,嫌い,嫌い,10,5,8,B
6,小久保,男,嫌い,嫌い,6,3,6,C
7,柴原,男,嫌い,嫌い,8,5,9,A

データを読み込む

> score <- read.csv(file="score.csv", head=TRUE)

2群からの平均値の比較であるので統計量はtとなる。ただし分散の等質性をを確認する。

> var.test(score[score$統計=="好き",7], score[score$統計=="嫌い",7])

        F test to compare two variances

data:  score[score$統計 == "好き", 7] and score[score$統計 == "嫌い", 7] 
F = 0.946, num df = 7, denom df = 11, p-value = 0.9781
alternative hypothesis: true ratio of variances is not equal to 1 
95 percent confidence interval:
 0.2516814 4.4550605 
sample estimates:
ratio of variances 
         0.9459792

帰無仮説は”母分散の比が1である”となる。対立仮説は”母分散の比は1ではない”

与えられたデータからF値は0.946となっている。自由度7/11におけるp値は0.9781となる。よって5%の有意水準では帰無仮説は棄却できない。つまり分散の等質性の仮定は満たされる。

データに対応はないために、対応がないt検定を行う。

 > t.test(score[score$統計=="好き",7], score[score$統計=="嫌い",7], var.equal=TRUE)

        Two Sample t-test

data:  score[score$統計 == "好き", 7] and score[score$統計 == "嫌い", 7] 
t = 2.1218, df = 18, p-value = 0.048
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 0.02250531 4.56082802 
sample estimates:
mean of x mean of y 
 8.375000  6.083333

データより統計量tは2.1218となる。自由度=18でp値は0.048となる。有意水準5%で帰無仮説は棄却される。よって統計が好きか嫌いかによって統計テスト1の結果に有意な差がある。

(2)性別により心理学テストの結果に有意な差があるか。

> var.test(score[score$性別=="男",6], score[score$性別=="女",6])

        F test to compare two variances

data:  score[score$性別 == "男", 6] and score[score$性別 == "女", 6] 
F = 1.5575, num df = 9, denom df = 9, p-value = 0.5196
alternative hypothesis: true ratio of variances is not equal to 1 
95 percent confidence interval:
 0.3868588 6.2704508 
sample estimates:
ratio of variances 
          1.557491

上記より分散の等質であるという帰無仮説が棄却されたのでWelchの検定を行う。

> t.test(score[score$性別=="男",6], score[score$性別=="女",6], var.equal=FALSE)

        Welch Two Sample t-test

data:  score[score$性別 == "男", 6] and score[score$性別 == "女", 6] 
t = 0.3836, df = 17.183, p-value = 0.706
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 -2.697454  3.897454 
sample estimates:
mean of x mean of y 
     10.3       9.7

p値は0.706となり、帰無仮説は棄却されない。よって有意な差があるとはいえない。

(3)ダイエットプログラムへの参加前後で体重に有意は変化が出ているかを調べる。

ダイエットデータはdiet.csvに作成する。

dietにdiet.csvを読み込む。

> diet <- read.csv(file="diet.csv", head=TRUE)
> head(diet)
  Before After
1     61    59
2     50    48
3     41    33
4     55    54
5     51    47
6     48    52

diet前後での比較なので個体は同じである。よって対応のあるt検定を実施する。

> t.test(diet$Before, diet$After, paired=TRUE)

        Paired t-test

data:  diet$Before and diet$After 
t = 2.8465, df = 9, p-value = 0.0192
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 0.6980082 6.1019918 
sample estimates:
mean of the differences 
                    3.4

t値は2.8465である。自由度9におけるpは0.0192となる。有意水準5%で帰無仮説は棄却される。よってダイエット前後で体重に変化はみられる。95%confidence intervalの区間は0.69~6.1となる。マイナスではないためにダイエットプログラムは効果があるといえる。

メタ情報

inarticle



メタ情報

inarticle



-R
-

執筆者:


  1. foo-bar-baz より:

    var.test や t.test は,
    var.test(統計テスト1 ~ 統計, data=score)
    t.test(統計テスト1 ~ 統計, data=score, var.equal=TRUE)
    などとする方が簡単ですし,分かりやすく,間違いが少ないと思います。
    また,read.csv は head=TRUE がデフォルトなので,省略することができます。

comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

主成分分析

Rで提供されているirisを使って主成分分析を実施する。 主成分分析の手順 データが分離できるか検証する 主成分負荷量と寄与率を求める 新しい変数に名前を付ける 変量プロット 主成分プロット 今回はR …

no image

分散分析のcase study-2

分散分析のcase study-1からの続き。 さて前回まででとりあえずデータの簡単な分析を終えて、以下のような結論を得た。 図1よりR1とR2を比較するとスピードはR1のほうが常に上である。またS1 …

no image

回帰分析

回帰分析の手順 データを取得する。 回帰分析をする意味があるかを検討する 回帰分析のモデルを検討する 回帰分析をする 回帰分析の結果について考察する 回帰分析のメモ 回帰分析では目的変数を説明できる変 …

no image

クラスタリング

Rによるクラスタ分析の実行 県別の持家率と自家用車普及率からクラスタ分析を実行し似た県を探してみる。。 データソース 持家と自家用車普及率のデータは下記から取得する 持家普及率のデータはこちらから取得 …

no image

Rによるやさしい統計学/4-母集団と標本

言葉の定義 推測統計、推定、点推定、区間推定、検定 標本、標本統計量、推定量、標本抽出、確率変数、確率分布、標本誤差 標本分布、標本統計量、平均、標準偏差、標準誤差 4.5 標本分布 標本平均の標本分 …

2014年5月
« 4月   6月 »
 1234
567891011
12131415161718
19202122232425
262728293031  

side bar top



アーカイブ

カテゴリー