科学の箱

科学・IT・登山の話題

R

Rによるやさしい統計学/5-統計的検定-1

投稿日:2014年4月30日 更新日:

5章で学ぶこと

5章では検定方法について紹介している。以下の方法について検定対象と検定する条件を理解する。

  • Z検定
  • t検定
  • 無相関検定
  • 独立性の検定

また検定の手順についてもまとめている。

検定方法

Z検定 平均値 正規分布 母分散σ^2が既知、一つの平均値
t検定 平均値 t分布 母分散未知、一つの平均値
無相関検定 相関係数 t分布
独立性の検定 質的変数の独立性、2つの質的変数の連関 カイ二乗分布

検定の手順

検定対象と条件により利用する検定方法は異なるが、検定手順は同じである。以下は記載されている手順を参考にして、作った手順である。

  • 検定対象を明らかにする
  • 条件を明らかにする
  • 検定モデルの選択
  • 帰無仮説と対立仮説を立てる
  • 検定統計量の選択
  • 有意水準の決定
  • 検定統計量の実現値を求める
  • 帰無仮説の棄却、採択を決定する

この章で学ぶ検定方法の一覧

  • Z検定
  • t検定
  • 無相関検定
  • カイ二乗検定

練習問題

5-1

帰無仮説はこのサンプルデータがとられた母集団の平均は170である。対立仮説は平均は170ではない。有意水準を5%として考える。利用する統計モデルは母集団の平均値について推定する。サンプル数は20あること、および母集団は正規分布に従っているためにt検定を利用できる。

t.test()を利用してt検定を行う。

> t.test(w_length, mu=170)

        One Sample t-test

data:  w_length 
t = -3.8503, df = 19, p-value = 0.001079
alternative hypothesis: true mean is not equal to 170 
95 percent confidence interval:
 160.584 167.216 
sample estimates:
mean of x 
    163.9

上記より、自由度19のt検定を行っている。対立仮説は”not equal to 170″であり両側検定となる。

サンプルの平均=163.9であり、ここから統計量t=-3.8503が求まる。これに対応するp値は0.001079である。有意水準5%以下であることからとしたので帰無仮説は棄却できる。

母集団平均の95%での信頼区間における推定値は160.584~167.216となる。

以下t.test()の結果の参考になる情報を記載しておく。

> qt(0.025,19)
[1] -2.093024
> qt(0.025,19, lower.tail=FALSE)
[1] 2.093024
> pt(2.093024,19)
[1] 0.975
> pt(-3.8503,19)
[1] 0.000539266

自由度19におけるt分布は以下のようなっている。

> curve(dt(x,19),-3,3)
> abline(v=qt(0.025,19))
> abline(v=qt(0.972,19))

tdist

メタ情報

inarticle



メタ情報

inarticle



-R

執筆者:


  1. foo-bar-baz より:

    [有意水準5%以下であることから]というのは,不適切でしょう
    [有意水準を5%としたので]とでも書くべき

comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

RStudioとR portableを連携させる

R Portableのダウンロードはこちらからできる。 http://sourceforge.net/projects/rportable/ R Studio Portableのダウンロードはこちらか …

no image

Wilcoxonの符号付順位決定

boneのspnbmdを使って年齢別に男女差があるかを確認してみる。検定ではWilcoxonの符号付順位決定を利用する。 boneは特定個人について骨密度を計測している。データにはIDと骨密度以外に性 …

no image

Rによるやさしい統計学/4-母集団と標本

言葉の定義 推測統計、推定、点推定、区間推定、検定 標本、標本統計量、推定量、標本抽出、確率変数、確率分布、標本誤差 標本分布、標本統計量、平均、標準偏差、標準誤差 4.5 標本分布 標本平均の標本分 …

no image

大気汚染データの観測

コーセラのDeveloping Data Productで知りたい場所の緯度経度を入力すると過去の観測データからオゾン濃度とPM25汚染濃度を予測するコードを紹介していた。Video Lectureの …

no image

tracertの分析

tracertを繰り返し実行した結果を分析し、経路上のホストについてどの程度時間がかかっているかを分析してみる。 tracertの結果は以下のように取得される。 $ tracert www.googl …

2014年4月
« 3月   5月 »
 123456
78910111213
14151617181920
21222324252627
282930  

side bar top



アーカイブ

カテゴリー