(1)　統計が好きか嫌いかで統計テスト1の得点について有意な差はあるか。

指導法データは score.csvに作成する。

ID,名前,性別,数学,統計,心理学テスト,統計テスト1,統計テスト2,指導法
1,大村,男,嫌い,好き,13,6,10,C
2,本多,男,嫌い,好き,14,10,13,B
3,川崎,男,好き,好き,7,6,8,B
4,多村,男,好き,好き,12,10,15,A
5,松中,男,嫌い,嫌い,10,5,8,B
6,小久保,男,嫌い,嫌い,6,3,6,C
7,柴原,男,嫌い,嫌い,8,5,9,A

データを読み込む

> score <- read.csv(file="score.csv", head=TRUE)

２群からの平均値の比較であるので統計量はtとなる。ただし分散の等質性をを確認する。

> var.test(score[score$統計=="好き",7], score[score$統計=="嫌い",7])

        F test to compare two variances

data:  score[score$統計 == "好き", 7] and score[score$統計 == "嫌い", 7] 
F = 0.946, num df = 7, denom df = 11, p-value = 0.9781
alternative hypothesis: true ratio of variances is not equal to 1 
95 percent confidence interval:
 0.2516814 4.4550605 
sample estimates:
ratio of variances 
         0.9459792

帰無仮説は”母分散の比が1である”となる。対立仮説は”母分散の比は1ではない”

与えられたデータからF値は0.946となっている。自由度7/11におけるp値は0.9781となる。よって5%の有意水準では帰無仮説は棄却できない。つまり分散の等質性の仮定は満たされる。

データに対応はないために、対応がないt検定を行う。

 > t.test(score[score$統計=="好き",7], score[score$統計=="嫌い",7], var.equal=TRUE)

        Two Sample t-test

data:  score[score$統計 == "好き", 7] and score[score$統計 == "嫌い", 7] 
t = 2.1218, df = 18, p-value = 0.048
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 0.02250531 4.56082802 
sample estimates:
mean of x mean of y 
 8.375000  6.083333

データより統計量tは2.1218となる。自由度=18でp値は0.048となる。有意水準5%で帰無仮説は棄却される。よって統計が好きか嫌いかによって統計テスト1の結果に有意な差がある。

(2)性別により心理学テストの結果に有意な差があるか。

> var.test(score[score$性別=="男",6], score[score$性別=="女",6])

        F test to compare two variances

data:  score[score$性別 == "男", 6] and score[score$性別 == "女", 6] 
F = 1.5575, num df = 9, denom df = 9, p-value = 0.5196
alternative hypothesis: true ratio of variances is not equal to 1 
95 percent confidence interval:
 0.3868588 6.2704508 
sample estimates:
ratio of variances 
          1.557491

上記より分散の等質であるという帰無仮説が棄却されたのでWelchの検定を行う。

> t.test(score[score$性別=="男",6], score[score$性別=="女",6], var.equal=FALSE)

        Welch Two Sample t-test

data:  score[score$性別 == "男", 6] and score[score$性別 == "女", 6] 
t = 0.3836, df = 17.183, p-value = 0.706
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 -2.697454  3.897454 
sample estimates:
mean of x mean of y 
     10.3       9.7

p値は0.706となり、帰無仮説は棄却されない。よって有意な差があるとはいえない。

(3)ダイエットプログラムへの参加前後で体重に有意は変化が出ているかを調べる。

ダイエットデータはdiet.csvに作成する。

dietにdiet.csvを読み込む。

> diet <- read.csv(file="diet.csv", head=TRUE)
> head(diet)
  Before After
1     61    59
2     50    48
3     41    33
4     55    54
5     51    47
6     48    52

diet前後での比較なので個体は同じである。よって対応のあるt検定を実施する。

> t.test(diet$Before, diet$After, paired=TRUE)

        Paired t-test

data:  diet$Before and diet$After 
t = 2.8465, df = 9, p-value = 0.0192
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 0.6980082 6.1019918 
sample estimates:
mean of the differences 
                    3.4

t値は2.8465である。自由度9におけるpは0.0192となる。有意水準5%で帰無仮説は棄却される。よってダイエット前後で体重に変化はみられる。95%confidence inteｒvalの区間は0.69～6.1となる。マイナスではないためにダイエットプログラムは効果があるといえる。

dataanalysis-002-week3

与えられたパラメータにもっとも近い値を探す

Rで%>%を利用する。

Rによるやさしい統計学/6-2つの平均値を比較する

(1)　統計が好きか嫌いかで統計テスト1の得点について有意な差はあるか。

(2)性別により心理学テストの結果に有意な差があるか。

(3)ダイエットプログラムへの参加前後で体重に有意は変化が出ているかを調べる。

Related posts:

月	火	水	木	金	土	日
« 4月				6月 »
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Rによるやさしい統計学/6-2つの平均値を比較する

(1) 統計が好きか嫌いかで統計テスト1の得点について有意な差はあるか。

(2)性別により心理学テストの結果に有意な差があるか。

(3)ダイエットプログラムへの参加前後で体重に有意は変化が出ているかを調べる。

Related posts:

(1)　統計が好きか嫌いかで統計テスト1の得点について有意な差はあるか。