科学の箱

科学・IT・登山の話題

機械学習 統計

多変量解析

投稿日:2014年1月21日 更新日:

多変量解析の分類

  • 回帰分析
  • ロジスティック分析
  • 判別分析
  • 主成分分析
  • 因子分析
  • 共分散
  • クラスタリング

共分散

  • Sxy = Σ(Xi – X~)(Yi – Y~) / n
  • 共分散が正・負ならば2変数に相関がある。0ならば相関はない。
  • 共分散は単位が変わると値が変わるために比較に使えない。これを改良したのがピアソンの相関係数 r(xy) = Sxy/SxSy

回帰分析

線形分析で当てはまらない場合には重回帰あるいは非線形分析を使う。

主成分分析

  • 身長・座高・体重・胸囲をまとめた体格・やせ具合という変数を作成する。
  • ネットワークの安定性の指標として帯域、レイテンシ、事故の回数、復旧時間をまとめる

因子分析

  • 血液型占いや文系・理系判断に使える。
  • 相関係数 ryy^ = 決定係数 R
  • 縦走関係数 Sy^2/Sy^2
  • 用語
    • 共通因子
    • 目的変数
    • 因子負荷量
    • 独自因子
    • 仮定
  • 相関ないと共分散は0に近くなる→よって0で近似してみる。
  • 直交モデルは4変数2因子までで仮定できる。
  • 直交モデルを前提としないのが、共分散構造分析'(SEM)
  • 変数が標準化されていると 相関係数 = 共分散

判別式

  • 判断するのに使うのが線形かマハラノビクス
  • 線形では平均値を使うが、これは標準偏差により実際の確率的な距離は異なってくる。
  • 判別式の使い道としては、個体分類、購入フラグ、合格フラグ、改善策必要フラグ、株式会フラグがある。

共分散構造分析

  • 最小2乗法を用いた探索的因子分析から確認的因子分析(最尤法を利用した共分散構造分析)へ展開する。
  • 適合関数として最小二乗法か最尤推定法を利用する。

質的変数の分析

  • 数量化I類 質→量 アンケート→売り上げを求める。
  • 数量化II類 質→質 生活学習態度→就職合格
  • 数量化III類 クロス集計
  • 数量化IV類 親和度
  • コレスポンダンス分析と対応分析は数量化III類に近い

メタ情報

inarticle



メタ情報

inarticle



-機械学習, 統計
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

ラテン方格

ラテン方格は1~nまでの数字についてn x nの正方行列に一回だけ現れるように並べたものである。ラテン方格を利用して実験の割り付けを行う実験計画法がラテン方格法である。 ラテン方格法と似た実験計画法に …

no image

仕事で始める機械学習 – 2.機械学習で何ができるか – 分類 – SVM

SVMの決定境界 SVMの決定境界はSVMで利用するカーネルにより異なる。 線形カーネル→線形 RBFカーネル→非線形 損失関数 損失関数としてはヒンジ関数を利用するが、パーセプトロンとは異なり、横軸 …

no image

データ分析の基本と業務

開発生産性は調和平均で計算する。 安全性の在庫の計算には正規分布を利用できる。 標準偏差=5であることを利用すると何が言えるか。 Z=1.96で95%をカバーする。 よって 5 x 1.96でほぼ10 …

no image

Excelによる単回帰分析

エクセルでの単回帰分析をについて手順をまとめる。エクセルの使い方にあわせて分析結果の解釈の仕方も書いておく。 データは勉強時間に対する点数とする。これは作ったデータであるが、線形回帰にフィットするよう …

no image

research pipeline

Related posts:tracertの分析irisデータを読み込んでseabornでいろいろ表示をしてみる。スパムメールの判別に使うベイズ定理についてまとめる

2014年1月
« 12月   2月 »
 12345
6789101112
13141516171819
20212223242526
2728293031  

side bar top



アーカイブ

カテゴリー