科学の箱

科学・IT・登山の話題

機械学習 統計

多変量解析

投稿日:2014年1月21日 更新日:

多変量解析の分類

  • 回帰分析
  • ロジスティック分析
  • 判別分析
  • 主成分分析
  • 因子分析
  • 共分散
  • クラスタリング

共分散

  • Sxy = Σ(Xi – X~)(Yi – Y~) / n
  • 共分散が正・負ならば2変数に相関がある。0ならば相関はない。
  • 共分散は単位が変わると値が変わるために比較に使えない。これを改良したのがピアソンの相関係数 r(xy) = Sxy/SxSy

回帰分析

線形分析で当てはまらない場合には重回帰あるいは非線形分析を使う。

主成分分析

  • 身長・座高・体重・胸囲をまとめた体格・やせ具合という変数を作成する。
  • ネットワークの安定性の指標として帯域、レイテンシ、事故の回数、復旧時間をまとめる

因子分析

  • 血液型占いや文系・理系判断に使える。
  • 相関係数 ryy^ = 決定係数 R
  • 縦走関係数 Sy^2/Sy^2
  • 用語
    • 共通因子
    • 目的変数
    • 因子負荷量
    • 独自因子
    • 仮定
  • 相関ないと共分散は0に近くなる→よって0で近似してみる。
  • 直交モデルは4変数2因子までで仮定できる。
  • 直交モデルを前提としないのが、共分散構造分析'(SEM)
  • 変数が標準化されていると 相関係数 = 共分散

判別式

  • 判断するのに使うのが線形かマハラノビクス
  • 線形では平均値を使うが、これは標準偏差により実際の確率的な距離は異なってくる。
  • 判別式の使い道としては、個体分類、購入フラグ、合格フラグ、改善策必要フラグ、株式会フラグがある。

共分散構造分析

  • 最小2乗法を用いた探索的因子分析から確認的因子分析(最尤法を利用した共分散構造分析)へ展開する。
  • 適合関数として最小二乗法か最尤推定法を利用する。

質的変数の分析

  • 数量化I類 質→量 アンケート→売り上げを求める。
  • 数量化II類 質→質 生活学習態度→就職合格
  • 数量化III類 クロス集計
  • 数量化IV類 親和度
  • コレスポンダンス分析と対応分析は数量化III類に近い

メタ情報

inarticle



メタ情報

inarticle



-機械学習, 統計
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

ポワソン分布の利用

一時間に平均7通のメールが来るとき100回試行した時のメール受信件数を調べる > rpois(100,7)  [1]  7 10  2  8  5  4  4  9  2  3  9  6  9 …

no image

Pythonではじめる機械学習 – k-Means

k-Meansの概要 k-Meansは教師なし学習の一つであり、あらかじめ指定された数にグループを分ける。 例えば今身長である程度まとまって席に座っている生徒を考えます。k-Meansでは最初に分ける …

no image

仕事で始める機械学習 – 1. 機械学習プロジェクトの始め方

機械学習プロジェクトの流れ 問題の定式化 機械学習を利用しない方法 システム設計 アルゴリズム選定 特徴量・教師データ・ログの設計 前処理 学習・パラメータチューニング システム統合 問題の定式化 目 …

no image

スパムメールの判別に使うベイズ定理についてまとめる

分類問題 スパムメールを判別するような問題は一般的に「分類問題」として機械学習では取り扱う。分類問題とはいまある「物」や「発生した事柄」を確率的に分類する。この「確率的」という言葉がみそであり、固定さ …

no image

線形回帰と最急降下法

線形回帰 世の中の様々な出来事(y)はある事象(x)に対して比例することが多い。もちろん厳密に比例するわけではなくずれは生じる。しかしこのxとyが比例すると仮定した場合、中学校で習った一次式でこの関係 …

2014年1月
« 12月   2月 »
 12345
6789101112
13141516171819
20212223242526
2728293031  

side bar top



アーカイブ

カテゴリー