科学の箱

科学・IT・登山の話題

機械学習

Statistical Reasoning for Public Health

投稿日:2014年4月16日 更新日:

Module up to 3

SES – 社会経済的地位

Cognitive function – 認知機能

The authors used the graphic alone to demonstrate the study findings. Why did they not need to first adjust for potential confounders?
As this is a randomized cohort study, the threat of confounding variables either distorting or masking (hiding) the main association of interest is minimal.

http://clinicaltrials.gov/show/NCT00697047

risk or risk ratio

  • risk – population level
  • risk ratio – individual level

odds ratio (relative odds)

Lecture 5

Time to event = Survival

イベントが起きる = censored

incidents rateの利用

カプラン-マイヤー法

Quiz – 2

効果があること = リスクの軽減として認識されるので、リスクの範疇で説明できる。

センサーの取り扱いについて確認すること

Lecture 6

Estimated SE by stimulation

marginal error

Lecture 7

sampleが少ないときのCLT利用について

CLTが利用できるサンプルの大きさ

t分布の利用

サンプルが小さければサンプルの誤差も大きくなるので推定に大きくなった誤差を考慮する。

dfが∞になると95%SEは1.96(正規分布と等しくなる)

Individual range from population ≠ 母集団の平均

Lecture 8

CI for comparing two population

2つのグループで統計量を比較するときに使える。

ratioスケールのレンジは0~1のためにright skewerdで正規分布に従わない。対数化すると正規化する。

Null values は2つの集団の統計量が等しいときの値

null valuesがcofidnece intervalにはいるならばno association(相関がない)といえる

null valuveがconfidence interval外ならばno assoicationではないといえ、統計的に有意となる。

リンパノードの発見をドクター別に比較して、明らかな差があるかを検定する。あれば、より優れた方法があることになる。

平均の比較

  • 異なった2つの方法のうちどちらが優れているか(時間を重ねてもよい、だめ)
  • before / after testing.

before/afterでは統計的に有意だとしても他の要因がある可能性があるのでコントロールグループとの比較が必要になる。ないと回帰だけであり、双方向の因果関係、見せ掛けの回帰などの落としあながある。

サンプルサイズが異なる場合には当然non-pairedになる。

差のSEはお互いのSEを足しこむことになる。

unpairedでnon-randomizedである場合には効果があっても別の要因による可能性がある。

Lecture 9

t検定であることは差があることだけであり、差の方向と差の度合いはわからない。

因果関係の検定にはコントロールグループとの比較がいる。

メタ情報

inarticle



メタ情報

inarticle



-機械学習
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

判別式

判別式の手順 散布図をプロットしてみてグループに分けることができるかを検討する 判別式のモデル(線形判別、マハラノビスなど)を検討する データを読み込み判別式テンプレートを作成する 判別式を作成する …

no image

pythonでEDAを実施する – 記述統計

データを取り込む data frameに変換する desdribe()メソッドで要約統計量を出力 各項目について残差分析(ここでは各データが平均値からどの程度離れているか、要するに分散の傾向を把握する …

no image

irisデータを読み込んでseabornでいろいろ表示をしてみる。

data可視化ライブラリのseabornではすぐに機械学習を始められるように質が良いデータが用意されている。その中でも最も有名であるirisについてpairplotを使って可視化してみる。 ここでは以 …

no image

ウェブ分析をハンズオンで学ぶ

ウェブ分析の本を読んでもあまりあたまに入ってこない。実際に手を動かさないと、身につかないわけである。 ということでハンズオンで実践して見ることにした。ハンズオンで実践するに当たり必要なのはデータとツー …

no image

Pythonではじめる機械学習 – k-Means

k-Meansの概要 k-Meansは教師なし学習の一つであり、あらかじめ指定された数にグループを分ける。 例えば今身長である程度まとまって席に座っている生徒を考えます。k-Meansでは最初に分ける …

2014年4月
« 3月   5月 »
 123456
78910111213
14151617181920
21222324252627
282930  

side bar top



アーカイブ

カテゴリー