科学の箱

科学・IT・登山の話題

機械学習 統計

多変量解析

投稿日:2014年1月21日 更新日:

多変量解析の分類

  • 回帰分析
  • ロジスティック分析
  • 判別分析
  • 主成分分析
  • 因子分析
  • 共分散
  • クラスタリング

共分散

  • Sxy = Σ(Xi – X~)(Yi – Y~) / n
  • 共分散が正・負ならば2変数に相関がある。0ならば相関はない。
  • 共分散は単位が変わると値が変わるために比較に使えない。これを改良したのがピアソンの相関係数 r(xy) = Sxy/SxSy

回帰分析

線形分析で当てはまらない場合には重回帰あるいは非線形分析を使う。

主成分分析

  • 身長・座高・体重・胸囲をまとめた体格・やせ具合という変数を作成する。
  • ネットワークの安定性の指標として帯域、レイテンシ、事故の回数、復旧時間をまとめる

因子分析

  • 血液型占いや文系・理系判断に使える。
  • 相関係数 ryy^ = 決定係数 R
  • 縦走関係数 Sy^2/Sy^2
  • 用語
    • 共通因子
    • 目的変数
    • 因子負荷量
    • 独自因子
    • 仮定
  • 相関ないと共分散は0に近くなる→よって0で近似してみる。
  • 直交モデルは4変数2因子までで仮定できる。
  • 直交モデルを前提としないのが、共分散構造分析'(SEM)
  • 変数が標準化されていると 相関係数 = 共分散

判別式

  • 判断するのに使うのが線形かマハラノビクス
  • 線形では平均値を使うが、これは標準偏差により実際の確率的な距離は異なってくる。
  • 判別式の使い道としては、個体分類、購入フラグ、合格フラグ、改善策必要フラグ、株式会フラグがある。

共分散構造分析

  • 最小2乗法を用いた探索的因子分析から確認的因子分析(最尤法を利用した共分散構造分析)へ展開する。
  • 適合関数として最小二乗法か最尤推定法を利用する。

質的変数の分析

  • 数量化I類 質→量 アンケート→売り上げを求める。
  • 数量化II類 質→質 生活学習態度→就職合格
  • 数量化III類 クロス集計
  • 数量化IV類 親和度
  • コレスポンダンス分析と対応分析は数量化III類に近い

メタ情報

inarticle



メタ情報

inarticle



-機械学習, 統計
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

回帰と分類の違い

回帰と分類は両方とも”予測”問題である。予測とは従属変数から目的変数を明らかにする。この目的変数の種類により回帰と分類に分けられる。 回帰では連続した数値を予測する。例えば株価 …

no image

ANOVA(分散分析)の考え方

ANOVAには2つの側面がある。一つは3つ以上の集団で統計量について違いがあるかを検定する。もう一つは重回帰分析により各要因を説明変数としたときに目的変数に対する影響を計算する。 この2つは数学的には …

no image

外れ値の把握

3シグマ法=Hampel Identifier Related posts:ANOVA(分散分析)の考え方データ分析について評価するSVD

no image

Core Concept in Data Analysis – Week 5

予測の分析 関連性を分析する モデルを明らかにする。 パラメータを推測する。 テストする。 予測が将来になると難しい→環境が変わってしまうため。 correlation structure (質的尺度 …

no image

Pythonではじめる機械学習 – 多様体学習

多様体学習 次元削減に利用できる手法として主成分分析がある。これは柔軟であり、すぐに実装可能な次元削減アルゴリズムの一つである。しかし一つだけ問題がある。それは主成分分析に適用できるデータは線形のみで …

2014年1月
« 12月   2月 »
 12345
6789101112
13141516171819
20212223242526
2728293031  

side bar top



アーカイブ

カテゴリー