科学の箱

科学・IT・登山の話題

機械学習

Core Concept in Data Analysis – Week 4

投稿日:2014年6月6日 更新日:

  • Contingency Table : 分割表
  • Nominal : 名目 (カテゴリカル)
  • Taxon : 分類
  • Marginal : 周辺
  • Conditional Probability : 条件付き確率
  • Quetlet index : ケトレー インデックス, BMIをさすことも多いが、ここではもうすこし講義

独立の意味

  • 独立であるときには P(A∧B) = P(A) ∧ P(B)
  • P(A∧B) > P(A) ∧ P(B)であるならば、AとBが同時に起きている(共起)しやすいので正の相関があるといえる。

Χ二乗

  • 共起の確率と個々の事象の発生確率の差を求めて、個々の発生確率の積で割ると、割合が計算できる。
  • 独立ならばΧ二乗値は0に近くなる。また個々の事象の発生確率が極端に小さいと、Χ二乗値は大きくなる。
  • Χ二乗分布の横軸がΧ二乗値
  • ピアソンΧ二乗値は相関を数字で表す→相関係数は量的尺度で使う。
  • 自由度は(列数-1) x (行数 -1)

Χ二乗のVisualize

  • High Positive  or High Negative
  • r, q or pr(ピアソン、ケトレー、?)

 

メタ情報

inarticle



メタ情報

inarticle



-機械学習
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

Core Concept in Data Analysis – Week 3

2d Analsysis 分布図 相関 回帰分析 因果関係 ガルトンはダーウィンのいとこ Related posts:売り上げデータの分析データ分析について評価する線形回帰とリッジ回帰を比較する

no image

判別式

判別式の手順 散布図をプロットしてみてグループに分けることができるかを検討する 判別式のモデル(線形判別、マハラノビスなど)を検討する データを読み込み判別式テンプレートを作成する 判別式を作成する …

no image

線形解析の基本手順

線形解析の基本手順 データの読み込み データフォーマット確認 EDA データクレンジング トレーニングデータ構築 モデル構築 モデル評価 予想 メトリック Related posts:Explorat …

no image

irisを教師なし学習で分類ーGMM

これまでは正解ラベルがある前提、つまり教師あり学習でモデルを構築した。今回は正解ラベルがない前提でモデルを構築する。 教師なし学習としては混合ガウスモデルを利用する。 内容 データの読み込み、前処理 …

no image

SIGNATE お弁当の需要予測-1

SIGNATEのコンペであるお弁当の需要予測をpythonで分析 データは下記から取得できる https://signate.jp/competitions/24 ライブラリ読み込み importnu …

2014年6月
« 5月   7月 »
 1
2345678
9101112131415
16171819202122
23242526272829
30  

side bar top



アーカイブ

カテゴリー