- Contingency Table : 分割表
- Nominal : 名目 (カテゴリカル)
- Taxon : 分類
- Marginal : 周辺
- Conditional Probability : 条件付き確率
- Quetlet index : ケトレー インデックス, BMIをさすことも多いが、ここではもうすこし講義
独立の意味
- 独立であるときには P(A∧B) = P(A) ∧ P(B)
- P(A∧B) > P(A) ∧ P(B)であるならば、AとBが同時に起きている(共起)しやすいので正の相関があるといえる。
Χ二乗
- 共起の確率と個々の事象の発生確率の差を求めて、個々の発生確率の積で割ると、割合が計算できる。
- 独立ならばΧ二乗値は0に近くなる。また個々の事象の発生確率が極端に小さいと、Χ二乗値は大きくなる。
- Χ二乗分布の横軸がΧ二乗値
- ピアソンΧ二乗値は相関を数字で表す→相関係数は量的尺度で使う。
- 自由度は(列数-1) x (行数 -1)
Χ二乗のVisualize
- High Positive or High Negative
- r, q or pr(ピアソン、ケトレー、?)