科学の箱

科学・IT・登山の話題

機械学習

Core Concept in Data Analysis – Week 4

投稿日:2014年6月6日 更新日:

  • Contingency Table : 分割表
  • Nominal : 名目 (カテゴリカル)
  • Taxon : 分類
  • Marginal : 周辺
  • Conditional Probability : 条件付き確率
  • Quetlet index : ケトレー インデックス, BMIをさすことも多いが、ここではもうすこし講義

独立の意味

  • 独立であるときには P(A∧B) = P(A) ∧ P(B)
  • P(A∧B) > P(A) ∧ P(B)であるならば、AとBが同時に起きている(共起)しやすいので正の相関があるといえる。

Χ二乗

  • 共起の確率と個々の事象の発生確率の差を求めて、個々の発生確率の積で割ると、割合が計算できる。
  • 独立ならばΧ二乗値は0に近くなる。また個々の事象の発生確率が極端に小さいと、Χ二乗値は大きくなる。
  • Χ二乗分布の横軸がΧ二乗値
  • ピアソンΧ二乗値は相関を数字で表す→相関係数は量的尺度で使う。
  • 自由度は(列数-1) x (行数 -1)

Χ二乗のVisualize

  • High Positive  or High Negative
  • r, q or pr(ピアソン、ケトレー、?)

 

メタ情報

inarticle



メタ情報

inarticle



-機械学習
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

Mahout in Action/chap2

2.1 レコメンドには2種類ある。 collaborative filtering contents based filtering collaborative filteringではコンテンツの内容 …

no image

K近傍法と決定木の比較

One of the most comprehensible non-parametric methods is k-nearest-neighbors: find the points which …

no image

dataanalysis-002-week5

ANOVA – quantitative 分散分析、数学的に分散分析と重回帰分析は同じ 分散分析では3群以上の平均の差異を検定する ただし非線形では異なる http://oshiete.g …

no image

UCI datasets

データ分析の勉強をするときに便利なUCI datasets https://archive.ics.uci.edu/ml/datasets.html Related posts:Mahout環境構築手 …

no image

Core Concept in Data Analysis – Week 1

パート Data Mining Core Analysis Visualization Illustrate Data Mining data mining = patterns in data + …

2014年6月
« 5月   7月 »
 1
2345678
9101112131415
16171819202122
23242526272829
30  

side bar top



アーカイブ

カテゴリー