科学・IＴ・登山の話題

機械学習統計

dataanalysis-002-week5

投稿日：2014年1月21日更新日：2014年6月6日

ANOVA – quantitative

分散分析、数学的に分散分析と重回帰分析は同じ
分散分析では3群以上の平均の差異を検定する
ただし非線形では異なる
http://oshiete.goo.ne.jp/qa/2859018.html

Binary outcome from regression.

勝ち負け、dead/alive, buy / not buy
線形回帰
線形 vs ロジスティック回帰 <- これでバイナリ出力ができる

カウント数が出力結果出るある場合

補正後の回帰分析は一つのオプション
ポワソン分布を使う
これを利用すれば確率的に発生する件数、人数がわかるので例えばリソースの割り当てが可能になる。
線形回帰もしくはポワソン・ログ回帰が使える
agnostic model
信頼空間

モデルチェック

overfitting
overtesting
biased inference

vcovHC

モデルの選択

ドメインの知識
Exploratory
統計的選択

統計的選択

Step-wise
AIC
BIC
LASSo, Ridge-Regression

mean variance relationship

mean variance relationshipがある場合にはロバスト標準誤差を利用する。

Related posts:

Mahout環境構築

R Dataset - bone

logistic regressionでの失敗

-機械学習, 統計
-coursera, R

執筆者：admin

comment コメントをキャンセル

関連記事

: Pythonではじめる機械学習 – Chap03

3.1 Types of Unsupervised Learning 教師なし学習の例次元削減: 重要な特徴量のみを使って元のデータを表現するトピック抽出: データを構成する部品を見つけるクラス …

: SVD

主成分分析はSVD（特異値分解）の特別なケースらしい。統計の本を見るといろいろと使い方を説明しているが、それをRでどのように実装するかとなると正直よくわかっていない。svd()を利用するのだが、統計の …

: 外れ値の把握

３シグマ法=Hampel Identifier Related posts:ウェルチの検定単変量解析と多変量解析カーネル密度関数

: make_blobsで分類データを作成する

sklearnで分類学習モデルを構築する際にテストデータが必要になる。手で作成したりあらかじめ用意されたデータを使うこともできるが、make_blobsを使ってランダムデータを作成できる。 sklea …

: 適切な検定方法を考える

統計における検定方法は状況と目的に応じて適切に選ぶ。従属変数の尺度から統計量が決まる。例えば従属変数が名義尺度であればt検定は利用できない。それに対して従属変数が量的変数であればさまざまな検定が可能と …

PREV: git rmを取り消す方法
NEXT: 多変量解析

GIMPでForeground color pickerが正しくない色をピックアップするときの対応方法 2021年9月7日
lerpとslerpの違い 2021年8月5日
シェーダーとは 2021年8月3日
Unityの座標系についてメモ 2021年7月1日
ALLとREMOVEFILTERSの違い 2021年6月28日