科学の箱

科学・IT・登山の話題

機械学習

Core Concept in Data Analysis – Week 4

投稿日:2014年6月6日 更新日:

  • Contingency Table : 分割表
  • Nominal : 名目 (カテゴリカル)
  • Taxon : 分類
  • Marginal : 周辺
  • Conditional Probability : 条件付き確率
  • Quetlet index : ケトレー インデックス, BMIをさすことも多いが、ここではもうすこし講義

独立の意味

  • 独立であるときには P(A∧B) = P(A) ∧ P(B)
  • P(A∧B) > P(A) ∧ P(B)であるならば、AとBが同時に起きている(共起)しやすいので正の相関があるといえる。

Χ二乗

  • 共起の確率と個々の事象の発生確率の差を求めて、個々の発生確率の積で割ると、割合が計算できる。
  • 独立ならばΧ二乗値は0に近くなる。また個々の事象の発生確率が極端に小さいと、Χ二乗値は大きくなる。
  • Χ二乗分布の横軸がΧ二乗値
  • ピアソンΧ二乗値は相関を数字で表す→相関係数は量的尺度で使う。
  • 自由度は(列数-1) x (行数 -1)

Χ二乗のVisualize

  • High Positive  or High Negative
  • r, q or pr(ピアソン、ケトレー、?)

 

メタ情報

inarticle



メタ情報

inarticle



-機械学習
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

SIGNATE お弁当の需要予測-2

データの内容を確認する。 期間を調べる d_train[‘datetime’].min() ‘ ‘2013-11-18’ d_train[‘datetime’].max() ‘ ‘2014-9-9’ …

no image

UCI datasets

データ分析の勉強をするときに便利なUCI datasets https://archive.ics.uci.edu/ml/datasets.html Related posts:dataanalysi …

no image

売り上げデータの分析

利益 = 売り上げ – コスト 売り上げ = 客数 x 客単価 コスト ≒ 人件費 + 廃棄コスト 客数 客単価 = Σ 品物i x 購入数 客数を増やす方法 来てもらう方法 安売りキャン …

no image

多変量解析

多変量解析の分類 回帰分析 ロジスティック分析 判別分析 主成分分析 因子分析 共分散 クラスタリング 共分散 Sxy = Σ(Xi – X~)(Yi – Y~) / n 共分 …

no image

dataanalysis-002-week2

Structure of Data Analysis 質問を定義する 理想的なデータセットの定義 アクセスできるデータの検索 データの取得 クレンジング Exploratory 統計的予測・モデリング …

2014年6月
« 5月   7月 »
 1
2345678
9101112131415
16171819202122
23242526272829
30  

side bar top



アーカイブ

カテゴリー