科学の箱

科学・IT・登山の話題

機械学習

dataanalysis-002-week1

投稿日:2013年12月9日 更新日:

Rstudioを開発に使う

  • 開発が用意
  • Forumがある
  • 標準
  • フリー

Help

  • R Mailling list
  • Stackoverflow
  • CrossValidated

R-Help

  • ?rnorm
  • args(rnorm)
  • rnorm

Rで的確なサポートを受けるために

  • 回答がほしい質問は何か
  • どんなツールを使っているか
  • 予期していたのは何か
  • 何が得られたか
  • 他にworkaroundは

Dataとはなにか

  • 集合に含まれる変数の値、定量もしくは定性。

値の表現方法

  • H1, W1
  • X11, X12
  • Y

ランダム値

  • 正規分布から取得された値
  • 正規分布のパラメータは平均と分散
  • 正規分布における大事な値 期待値、分散、標準偏差
  • 条件付け x | μ   Xは条件μにおけるランダム値

分布の種類

  • 二項分布
  • 正規分布
  • 一様分布

DataAnalysisで解決する問題

  • Descriptive
  • Exploratory
    • 変数間に関係があることがわかればよい、主なツールはチャート
  • Infer
  • Predictive
    • Exploratoryで明らかになった関連がある変数について回帰分析を行う
  • Causal
  • Machine

Vector, List, matrices, data frameの違い

  • vector: 同じクラスの複数の値
  • list: 異なるクラスの複数の値
  • matrices: 同じクラスで多次元
  • data frmae: 異なるクラスで同じ長さ

メタ情報

inarticle



メタ情報

inarticle



-機械学習
-,

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

Pythonではじめる機械学習 – Chap05 – Model Evaluation and Improvement

Chapter 5. Model Evaluation and Improvement 学習モデルの評価 定量的なモデルの評価は教師付きモデルが主になる。 教師なしモデルは定性的なアプローチで評価する …

no image

判別式

判別式の手順 散布図をプロットしてみてグループに分けることができるかを検討する 判別式のモデル(線形判別、マハラノビスなど)を検討する データを読み込み判別式テンプレートを作成する 判別式を作成する …

no image

Mahout環境構築

Mahoutのシステム要件を確認する。 Java 1.6.x or greater. Maven 3.x to build the source code. CPU, Disk and Memory …

no image

UCI datasets

データ分析の勉強をするときに便利なUCI datasets https://archive.ics.uci.edu/ml/datasets.html Related posts:スピアマンの順位相関K …

no image

irisデータについて簡単な機械学習をしてみる

irisデータを使って簡単な機械学習をしてみる。 ここで説明している内容は以下になる。 データの読み込み、前処理 トレインデータと検証データへの分割 モデル選定 モデル構築および検証 データの読み込み …

2013年12月
« 11月   1月 »
 1
2345678
9101112131415
16171819202122
23242526272829
3031  

side bar top



アーカイブ

カテゴリー