科学の箱

科学・IT・登山の話題

機械学習

dataanalysis-002-week1

投稿日:2013年12月9日 更新日:

Rstudioを開発に使う

  • 開発が用意
  • Forumがある
  • 標準
  • フリー

Help

  • R Mailling list
  • Stackoverflow
  • CrossValidated

R-Help

  • ?rnorm
  • args(rnorm)
  • rnorm

Rで的確なサポートを受けるために

  • 回答がほしい質問は何か
  • どんなツールを使っているか
  • 予期していたのは何か
  • 何が得られたか
  • 他にworkaroundは

Dataとはなにか

  • 集合に含まれる変数の値、定量もしくは定性。

値の表現方法

  • H1, W1
  • X11, X12
  • Y

ランダム値

  • 正規分布から取得された値
  • 正規分布のパラメータは平均と分散
  • 正規分布における大事な値 期待値、分散、標準偏差
  • 条件付け x | μ   Xは条件μにおけるランダム値

分布の種類

  • 二項分布
  • 正規分布
  • 一様分布

DataAnalysisで解決する問題

  • Descriptive
  • Exploratory
    • 変数間に関係があることがわかればよい、主なツールはチャート
  • Infer
  • Predictive
    • Exploratoryで明らかになった関連がある変数について回帰分析を行う
  • Causal
  • Machine

Vector, List, matrices, data frameの違い

  • vector: 同じクラスの複数の値
  • list: 異なるクラスの複数の値
  • matrices: 同じクラスで多次元
  • data frmae: 異なるクラスで同じ長さ

メタ情報

inarticle



メタ情報

inarticle



-機械学習
-,

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

ポワソン分布の利用

一時間に平均7通のメールが来るとき100回試行した時のメール受信件数を調べる > rpois(100,7)  [1]  7 10  2  8  5  4  4  9  2  3  9  6  9 …

no image

データ分析の基本と業務

開発生産性は調和平均で計算する。 安全性の在庫の計算には正規分布を利用できる。 標準偏差=5であることを利用すると何が言えるか。 Z=1.96で95%をカバーする。 よって 5 x 1.96でほぼ10 …

no image

線形回帰とリッジ回帰を比較する

リッジ回帰はL2ノルムの正則項を導入することで、過学習を防ぐ。この場合過学習を防ぐとは、重みを0の方向に動かすという意味である。実際に線形回帰とリッジ回帰を比べてみて、どのようにモデルが変わるかを確認 …

no image

Mahout環境構築

Mahoutのシステム要件を確認する。 Java 1.6.x or greater. Maven 3.x to build the source code. CPU, Disk and Memory …

no image

Core Concept in Data Analysis – Week 5

予測の分析 関連性を分析する モデルを明らかにする。 パラメータを推測する。 テストする。 予測が将来になると難しい→環境が変わってしまうため。 correlation structure (質的尺度 …

2013年12月
« 11月   1月 »
 1
2345678
9101112131415
16171819202122
23242526272829
3031  

side bar top



アーカイブ

カテゴリー