科学の箱

科学・IT・登山の話題

機械学習 統計

前向き研究と後ろ向き研究

投稿日:

前向き研究と後ろ向き研究は疫学における用語である。

前向き研究で使われる研究手法にはコホートや無作為比較対照研究、ロジスティック分析がある。これらの研究ではサンプルをリスクファクター(危険要因)のあるなしや、要因へさらされる程度によってグループに分割し、長期間にわたって影響を観察する。要因にさらされる度合いをコントロールできるために要因と結果について正しい因果関係が得られやすい。研究には十分なサンプル数と長期間にわたる観察が必要であるために手間とコストがかかりやすいく、大規模な研究となる。

後ろ向き研究では発症したかしていないか、あるいは健康状態がよいか、わるいかでサンプルを2つに分ける。前向き研究とは異なりすでに起きた結果でグループを分け、リスクファクターの度合い、要因の寄与度を分析する。判別分析は後ろ向き研究に使われる。

ロジスティック分析と判別分析は似た方法であるが、独立変数、目的変数の条件が異なる。

ロジスティック分析は独立変数の効果をオッズ比から明らかにできる。また独立変数が正規分布に従う必要はない。ロジスティック分析では、オッズ比に より発生確率の変化のみを明らかにする。ロジステック分析ではオッズ比による確率分布を求めるために○か×の閾値をずらすことができる。またっ独立変数に量的尺 度だけでなく名義尺度を含むことができる。

判別分析の独立変数は正規分布に従う必要があるために量的尺度のみが対象となる。。また個々の独立変数の効果については考慮しない。判別分析では目的変数を判別するための閾値をみつける。

ロジスティック分析では目的変数が確率変数であってもよい。例えばある条件でも確率的に発生する場合と発生しない場合があるというのが許される。判別分析における目的変数は確定的であること、たとえば男と女とか、合格とか不合格であり誤差はゆるされない。

メタ情報

inarticle



メタ情報

inarticle



-機械学習, 統計

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

ポワソン分布の利用

一時間に平均7通のメールが来るとき100回試行した時のメール受信件数を調べる > rpois(100,7)  [1]  7 10  2  8  5  4  4  9  2  3  9  6  9 …

no image

irisを教師なし学習で分類ーGMM

これまでは正解ラベルがある前提、つまり教師あり学習でモデルを構築した。今回は正解ラベルがない前提でモデルを構築する。 教師なし学習としては混合ガウスモデルを利用する。 内容 データの読み込み、前処理 …

no image

実践ワークショップExcel徹底活用ビジネスデータ分析

メモ 相関係数の行列で傾向が似ている変数を探すことができる。例えば過去データとして商品A,B,C,D,E,Fがあるとする。今商品Xを開発し、マーケティング方法を決めたい。この時A~Fについてはすでに売 …

no image

線形解析の基本手順

線形解析の基本手順 データの読み込み データフォーマット確認 EDA データクレンジング トレーニングデータ構築 モデル構築 モデル評価 予想 メトリック Related posts:Statisti …

no image

Pythonではじめる機械学習 – Chap04

4.4 Binning, Discretization, Linear Models, and Trees ビン化のメリット 決定木でビン化するメリットはあまりない 決定木はモデルの中で一つの特徴につ …

2014年3月
« 2月   4月 »
 12
3456789
10111213141516
17181920212223
24252627282930
31  

side bar top



アーカイブ

カテゴリー