科学の箱

科学・IT・登山の話題

機械学習 統計

多変量解析

投稿日:2014年1月21日 更新日:

多変量解析の分類

  • 回帰分析
  • ロジスティック分析
  • 判別分析
  • 主成分分析
  • 因子分析
  • 共分散
  • クラスタリング

共分散

  • Sxy = Σ(Xi – X~)(Yi – Y~) / n
  • 共分散が正・負ならば2変数に相関がある。0ならば相関はない。
  • 共分散は単位が変わると値が変わるために比較に使えない。これを改良したのがピアソンの相関係数 r(xy) = Sxy/SxSy

回帰分析

線形分析で当てはまらない場合には重回帰あるいは非線形分析を使う。

主成分分析

  • 身長・座高・体重・胸囲をまとめた体格・やせ具合という変数を作成する。
  • ネットワークの安定性の指標として帯域、レイテンシ、事故の回数、復旧時間をまとめる

因子分析

  • 血液型占いや文系・理系判断に使える。
  • 相関係数 ryy^ = 決定係数 R
  • 縦走関係数 Sy^2/Sy^2
  • 用語
    • 共通因子
    • 目的変数
    • 因子負荷量
    • 独自因子
    • 仮定
  • 相関ないと共分散は0に近くなる→よって0で近似してみる。
  • 直交モデルは4変数2因子までで仮定できる。
  • 直交モデルを前提としないのが、共分散構造分析'(SEM)
  • 変数が標準化されていると 相関係数 = 共分散

判別式

  • 判断するのに使うのが線形かマハラノビクス
  • 線形では平均値を使うが、これは標準偏差により実際の確率的な距離は異なってくる。
  • 判別式の使い道としては、個体分類、購入フラグ、合格フラグ、改善策必要フラグ、株式会フラグがある。

共分散構造分析

  • 最小2乗法を用いた探索的因子分析から確認的因子分析(最尤法を利用した共分散構造分析)へ展開する。
  • 適合関数として最小二乗法か最尤推定法を利用する。

質的変数の分析

  • 数量化I類 質→量 アンケート→売り上げを求める。
  • 数量化II類 質→質 生活学習態度→就職合格
  • 数量化III類 クロス集計
  • 数量化IV類 親和度
  • コレスポンダンス分析と対応分析は数量化III類に近い

メタ情報

inarticle



メタ情報

inarticle



-機械学習, 統計
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

UCI datasets

データ分析の勉強をするときに便利なUCI datasets https://archive.ics.uci.edu/ml/datasets.html Related posts:データ取り込み後に確認 …

no image

ウェルチの検定

対応していない2つのグループ間で平均を比べる方法としてはt検定がある。ただしt検定では2つの前提がある。ひとつは正規性、もうひとつは等分散である。正規性の前提では独立変数は正規分布に従っている。等分散 …

no image

K近傍法と決定木の比較

One of the most comprehensible non-parametric methods is k-nearest-neighbors: find the points which …

no image

データ取り込み後に確認すること

# tidyデータの原則 # 1カラム = 1変数 # 1行 = 1観察 # 1テーブル = 1 unique key # foreign key to link # テーブル全体で見ること # カラ …

no image

回帰と分類の違い

回帰と分類は両方とも”予測”問題である。予測とは従属変数から目的変数を明らかにする。この目的変数の種類により回帰と分類に分けられる。 回帰では連続した数値を予測する。例えば株価 …

2014年1月
« 12月   2月 »
 12345
6789101112
13141516171819
20212223242526
2728293031  

side bar top



アーカイブ

カテゴリー