多変量解析の分類
- 回帰分析
- ロジスティック分析
- 判別分析
- 主成分分析
- 因子分析
- 共分散
- クラスタリング
共分散
- Sxy = Σ(Xi – X~)(Yi – Y~) / n
- 共分散が正・負ならば2変数に相関がある。0ならば相関はない。
- 共分散は単位が変わると値が変わるために比較に使えない。これを改良したのがピアソンの相関係数 r(xy) = Sxy/SxSy
回帰分析
線形分析で当てはまらない場合には重回帰あるいは非線形分析を使う。
主成分分析
- 身長・座高・体重・胸囲をまとめた体格・やせ具合という変数を作成する。
- ネットワークの安定性の指標として帯域、レイテンシ、事故の回数、復旧時間をまとめる
因子分析
- 血液型占いや文系・理系判断に使える。
- 相関係数 ryy^ = 決定係数 R
- 縦走関係数 Sy^2/Sy^2
- 用語
- 共通因子
- 目的変数
- 因子負荷量
- 独自因子
- 仮定
- 相関ないと共分散は0に近くなる→よって0で近似してみる。
- 直交モデルは4変数2因子までで仮定できる。
- 直交モデルを前提としないのが、共分散構造分析'(SEM)
- 変数が標準化されていると 相関係数 = 共分散
判別式
- 判断するのに使うのが線形かマハラノビクス
- 線形では平均値を使うが、これは標準偏差により実際の確率的な距離は異なってくる。
- 判別式の使い道としては、個体分類、購入フラグ、合格フラグ、改善策必要フラグ、株式会フラグがある。
共分散構造分析
- 最小2乗法を用いた探索的因子分析から確認的因子分析(最尤法を利用した共分散構造分析)へ展開する。
- 適合関数として最小二乗法か最尤推定法を利用する。
質的変数の分析
- 数量化I類 質→量 アンケート→売り上げを求める。
- 数量化II類 質→質 生活学習態度→就職合格
- 数量化III類 クロス集計
- 数量化IV類 親和度
- コレスポンダンス分析と対応分析は数量化III類に近い