(1) 統計が好きか嫌いかで統計テスト1の得点について有意な差はあるか。
指導法データは score.csvに作成する。
ID,名前,性別,数学,統計,心理学テスト,統計テスト1,統計テスト2,指導法 1,大村,男,嫌い,好き,13,6,10,C 2,本多,男,嫌い,好き,14,10,13,B 3,川崎,男,好き,好き,7,6,8,B 4,多村,男,好き,好き,12,10,15,A 5,松中,男,嫌い,嫌い,10,5,8,B 6,小久保,男,嫌い,嫌い,6,3,6,C 7,柴原,男,嫌い,嫌い,8,5,9,A
データを読み込む
> score <- read.csv(file="score.csv", head=TRUE)
2群からの平均値の比較であるので統計量はtとなる。ただし分散の等質性をを確認する。
> var.test(score[score$統計=="好き",7], score[score$統計=="嫌い",7]) F test to compare two variances data: score[score$統計 == "好き", 7] and score[score$統計 == "嫌い", 7] F = 0.946, num df = 7, denom df = 11, p-value = 0.9781 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.2516814 4.4550605 sample estimates: ratio of variances 0.9459792
帰無仮説は”母分散の比が1である”となる。対立仮説は”母分散の比は1ではない”
与えられたデータからF値は0.946となっている。自由度7/11におけるp値は0.9781となる。よって5%の有意水準では帰無仮説は棄却できない。つまり分散の等質性の仮定は満たされる。
データに対応はないために、対応がないt検定を行う。
> t.test(score[score$統計=="好き",7], score[score$統計=="嫌い",7], var.equal=TRUE) Two Sample t-test data: score[score$統計 == "好き", 7] and score[score$統計 == "嫌い", 7] t = 2.1218, df = 18, p-value = 0.048 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 0.02250531 4.56082802 sample estimates: mean of x mean of y 8.375000 6.083333
データより統計量tは2.1218となる。自由度=18でp値は0.048となる。有意水準5%で帰無仮説は棄却される。よって統計が好きか嫌いかによって統計テスト1の結果に有意な差がある。
(2)性別により心理学テストの結果に有意な差があるか。
> var.test(score[score$性別=="男",6], score[score$性別=="女",6]) F test to compare two variances data: score[score$性別 == "男", 6] and score[score$性別 == "女", 6] F = 1.5575, num df = 9, denom df = 9, p-value = 0.5196 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.3868588 6.2704508 sample estimates: ratio of variances 1.557491
上記より分散の等質であるという帰無仮説が棄却されたのでWelchの検定を行う。
> t.test(score[score$性別=="男",6], score[score$性別=="女",6], var.equal=FALSE) Welch Two Sample t-test data: score[score$性別 == "男", 6] and score[score$性別 == "女", 6] t = 0.3836, df = 17.183, p-value = 0.706 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -2.697454 3.897454 sample estimates: mean of x mean of y 10.3 9.7
p値は0.706となり、帰無仮説は棄却されない。よって有意な差があるとはいえない。
(3)ダイエットプログラムへの参加前後で体重に有意は変化が出ているかを調べる。
ダイエットデータはdiet.csvに作成する。
dietにdiet.csvを読み込む。
> diet <- read.csv(file="diet.csv", head=TRUE) > head(diet) Before After 1 61 59 2 50 48 3 41 33 4 55 54 5 51 47 6 48 52
diet前後での比較なので個体は同じである。よって対応のあるt検定を実施する。
> t.test(diet$Before, diet$After, paired=TRUE) Paired t-test data: diet$Before and diet$After t = 2.8465, df = 9, p-value = 0.0192 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 0.6980082 6.1019918 sample estimates: mean of the differences 3.4
t値は2.8465である。自由度9におけるpは0.0192となる。有意水準5%で帰無仮説は棄却される。よってダイエット前後で体重に変化はみられる。95%confidence intervalの区間は0.69~6.1となる。マイナスではないためにダイエットプログラムは効果があるといえる。
var.test や t.test は,
var.test(統計テスト1 ~ 統計, data=score)
t.test(統計テスト1 ~ 統計, data=score, var.equal=TRUE)
などとする方が簡単ですし,分かりやすく,間違いが少ないと思います。
また,read.csv は head=TRUE がデフォルトなので,省略することができます。