科学・IＴ・登山の話題

機械学習統計

dataanalysis-002-week6

投稿日：2014年1月10日更新日：2014年6月6日

prediction study

motivation
手順
データの選択
エラーの測定
デザイン

データの分割

トレーニング
テスト
検証

true false positives

true positive
false positive
true negative
false negative

Error rate

Prediction Analysis

統計の方法というよりも予測をするための手順であり、モデルを決定するときに回帰分析などを使う。

Cross validation(交差検定）

どのような手法をとって予測をしたとしてもCross validationによってモデルを検証すること。

Prediction with regression

lm/glmは簡単で便利、線形であれば比較的よい結果を出す。ただし非線形であれば使えない。案外世の中は非線形がおおい。

手順

モデルが線形フィットするかを確認する

トレーニングセットとテストセットをつくる

線形回帰をする

テストをしてみる

トレーニングセットとテストセットのエラーを取得する

カットオフを検証する

モデルをcross validationで比較する

Prediction with trees

Related posts:

分散分析のcase study-2

make_blobsで分類データを作成する

Pythonではじめる機械学習 - k-Means

-機械学習, 統計
-coursera, R

執筆者：admin

comment コメントをキャンセル

関連記事

: 仕事で始める機械学習 – 2.機械学習で何ができるか – 分類 – パーセプトロン

パーセプトロン判別式それぞれのデータに対して重みづけした値ヒンジ損失パーセプトロンの損失関数をヒンジ損失という。パーセプトロン基準とも呼ばれる。 sum(wx) 状態ラベル label*su …

: データ分析について評価する

デザインコントロールグループはあるかモデル検定の前提は満たしているか（正規分布）従属変数の尺度は適切か（名義、順序、間隔、比率）独立変数の数は適切かモデルについて説明できるか（独立変数の数 …

: Statistical Reasoning for Public Health

Module up to 3 SES – 社会経済的地位 Cognitive function – 認知機能 The authors used the graphic alon …

: 数値項目の分析テンプレート

数値フィールド1 数値フィールド1 rate – 1 rate – 2 データ型算術平均中央値分散トップ3 ボトム3 足切時系列分析層別候補ヒストグラムカウント …

: Excelによる単回帰分析

エクセルでの単回帰分析をについて手順をまとめる。エクセルの使い方にあわせて分析結果の解釈の仕方も書いておく。データは勉強時間に対する点数とする。これは作ったデータであるが、線形回帰にフィットするよう …

PREV: Shutting down Smb2-Signing blade for this connection. Reason - Connection is blacklisted for signing optimization.
NEXT: Rによるやさしい統計学/3-2つの変数の記述統計

GIMPでForeground color pickerが正しくない色をピックアップするときの対応方法 2021年9月7日
lerpとslerpの違い 2021年8月5日
シェーダーとは 2021年8月3日
Unityの座標系についてメモ 2021年7月1日
ALLとREMOVEFILTERSの違い 2021年6月28日