科学の箱

科学・IT・登山の話題

機械学習 統計

dataanalysis-002-week5

投稿日:2014年1月21日 更新日:

ANOVA – quantitative

  • 分散分析、数学的に分散分析と重回帰分析は同じ
  • 分散分析では3群以上の平均の差異を検定する
  • ただし非線形では異なる
  • http://oshiete.goo.ne.jp/qa/2859018.html

Binary outcome from regression.

  • 勝ち負け、dead/alive, buy / not buy
  • 線形回帰
  • 線形 vs ロジスティック回帰 <- これでバイナリ出力ができる

カウント数が出力結果出るある場合

  • 補正後の回帰分析は一つのオプション
  • ポワソン分布を使う
  • これを利用すれば確率的に発生する件数、人数がわかるので例えばリソースの割り当てが可能になる。
  • 線形回帰もしくはポワソン・ログ回帰が使える
  • agnostic model
  • 信頼空間

モデルチェック

  • overfitting
  • overtesting
  • biased inference

vcovHC

モデルの選択

  • ドメインの知識
  • Exploratory
  • 統計的選択

統計的選択

  • Step-wise
  • AIC
  • BIC
  • LASSo, Ridge-Regression

mean variance relationship

  • mean variance relationshipがある場合にはロバスト標準誤差を利用する。

メタ情報

inarticle



メタ情報

inarticle



-機械学習, 統計
-,

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

Pythonではじめる機械学習 – k-Means

k-Meansの概要 k-Meansは教師なし学習の一つであり、あらかじめ指定された数にグループを分ける。 例えば今身長である程度まとまって席に座っている生徒を考えます。k-Meansでは最初に分ける …

no image

回帰と分類の違い

回帰と分類は両方とも”予測”問題である。予測とは従属変数から目的変数を明らかにする。この目的変数の種類により回帰と分類に分けられる。 回帰では連続した数値を予測する。例えば株価 …

no image

irisをナイーブベイズで分類

ナイーブベイズの概要 ナイーブベイズは教師ありの分類アルゴリズムの一つである。 計算アルゴリズムとしてはベイズ定理を用いている。 機械学習における特徴としてはいかがある 実装が簡単であり、複雑なハイパ …

no image

仕事で始める機械学習 – 6章 効果検証

効果検証のステップ 問題認識: 顧客の機器利用率が低い 問題の影響: 長期的なメンテナンス契約からの利益の確保 課題設定候補: メンテナンス以外からの利益確保 新規顧客からの利益 顧客利用率を上げる …

no image

make_blobsで分類データを作成する

sklearnで分類学習モデルを構築する際にテストデータが必要になる。手で作成したりあらかじめ用意されたデータを使うこともできるが、make_blobsを使ってランダムデータを作成できる。 sklea …

2014年1月
« 12月   2月 »
 12345
6789101112
13141516171819
20212223242526
2728293031  

side bar top



アーカイブ

カテゴリー