科学の箱

科学・IT・登山の話題

機械学習 統計

前向き研究と後ろ向き研究

投稿日:

前向き研究と後ろ向き研究は疫学における用語である。

前向き研究で使われる研究手法にはコホートや無作為比較対照研究、ロジスティック分析がある。これらの研究ではサンプルをリスクファクター(危険要因)のあるなしや、要因へさらされる程度によってグループに分割し、長期間にわたって影響を観察する。要因にさらされる度合いをコントロールできるために要因と結果について正しい因果関係が得られやすい。研究には十分なサンプル数と長期間にわたる観察が必要であるために手間とコストがかかりやすいく、大規模な研究となる。

後ろ向き研究では発症したかしていないか、あるいは健康状態がよいか、わるいかでサンプルを2つに分ける。前向き研究とは異なりすでに起きた結果でグループを分け、リスクファクターの度合い、要因の寄与度を分析する。判別分析は後ろ向き研究に使われる。

ロジスティック分析と判別分析は似た方法であるが、独立変数、目的変数の条件が異なる。

ロジスティック分析は独立変数の効果をオッズ比から明らかにできる。また独立変数が正規分布に従う必要はない。ロジスティック分析では、オッズ比に より発生確率の変化のみを明らかにする。ロジステック分析ではオッズ比による確率分布を求めるために○か×の閾値をずらすことができる。またっ独立変数に量的尺 度だけでなく名義尺度を含むことができる。

判別分析の独立変数は正規分布に従う必要があるために量的尺度のみが対象となる。。また個々の独立変数の効果については考慮しない。判別分析では目的変数を判別するための閾値をみつける。

ロジスティック分析では目的変数が確率変数であってもよい。例えばある条件でも確率的に発生する場合と発生しない場合があるというのが許される。判別分析における目的変数は確定的であること、たとえば男と女とか、合格とか不合格であり誤差はゆるされない。

メタ情報

inarticle



メタ情報

inarticle



-機械学習, 統計

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

Core Concept in Data Analysis – Week 1

パート Data Mining Core Analysis Visualization Illustrate Data Mining data mining = patterns in data + …

no image

irisデータについて簡単な機械学習をしてみる

irisデータを使って簡単な機械学習をしてみる。 ここで説明している内容は以下になる。 データの読み込み、前処理 トレインデータと検証データへの分割 モデル選定 モデル構築および検証 データの読み込み …

no image

仕事で始める機械学習 – 3.学習結果を評価しよう – 指標

主な指標 モデル構築後に確認する主な指標は4つある。 正解率 適合率 再現率 F値 正解率 $$ 正解率 = \frac{TP + TN}{TP+FP+TN+FN} $$ 正解率は全データ数に対する正 …

no image

dataanalysis-002-week5

ANOVA – quantitative 分散分析、数学的に分散分析と重回帰分析は同じ 分散分析では3群以上の平均の差異を検定する ただし非線形では異なる http://oshiete.g …

no image

Mahout環境構築

Mahoutのシステム要件を確認する。 Java 1.6.x or greater. Maven 3.x to build the source code. CPU, Disk and Memory …

2014年3月
« 2月   4月 »
 12
3456789
10111213141516
17181920212223
24252627282930
31  

side bar top



アーカイブ

カテゴリー