prediction study
- motivation
- 手順
- データの選択
- エラーの測定
- デザイン
データの分割
- トレーニング
- テスト
- 検証
true false positives
- true positive
- false positive
- true negative
- false negative
Error rate
Prediction Analysis
統計の方法というよりも予測をするための手順であり、モデルを決定するときに回帰分析などを使う。
Cross validation(交差検定)
どのような手法をとって予測をしたとしてもCross validationによってモデルを検証すること。
Prediction with regression
lm/glmは簡単で便利、線形であれば比較的よい結果を出す。ただし非線形であれば使えない。案外世の中は非線形がおおい。
手順
- モデルが線形フィットするかを確認する
- トレーニングセットとテストセットをつくる
- 線形回帰をする
- テストをしてみる
- トレーニングセットとテストセットのエラーを取得する
- カットオフを検証する
- モデルをcross validationで比較する
Prediction with trees