科学の箱

科学・IT・登山の話題

機械学習

dataanalysis-002-week1

投稿日:2013年12月9日 更新日:

Rstudioを開発に使う

  • 開発が用意
  • Forumがある
  • 標準
  • フリー

Help

  • R Mailling list
  • Stackoverflow
  • CrossValidated

R-Help

  • ?rnorm
  • args(rnorm)
  • rnorm

Rで的確なサポートを受けるために

  • 回答がほしい質問は何か
  • どんなツールを使っているか
  • 予期していたのは何か
  • 何が得られたか
  • 他にworkaroundは

Dataとはなにか

  • 集合に含まれる変数の値、定量もしくは定性。

値の表現方法

  • H1, W1
  • X11, X12
  • Y

ランダム値

  • 正規分布から取得された値
  • 正規分布のパラメータは平均と分散
  • 正規分布における大事な値 期待値、分散、標準偏差
  • 条件付け x | μ   Xは条件μにおけるランダム値

分布の種類

  • 二項分布
  • 正規分布
  • 一様分布

DataAnalysisで解決する問題

  • Descriptive
  • Exploratory
    • 変数間に関係があることがわかればよい、主なツールはチャート
  • Infer
  • Predictive
    • Exploratoryで明らかになった関連がある変数について回帰分析を行う
  • Causal
  • Machine

Vector, List, matrices, data frameの違い

  • vector: 同じクラスの複数の値
  • list: 異なるクラスの複数の値
  • matrices: 同じクラスで多次元
  • data frmae: 異なるクラスで同じ長さ

メタ情報

inarticle



メタ情報

inarticle



-機械学習
-,

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

データ分析について評価する

デザイン コントロールグループはあるか モデル 検定の前提は満たしているか(正規分布) 従属変数の尺度は適切か(名義、順序、間隔、比率) 独立変数の数は適切か モデルについて説明できるか(独立変数の数 …

no image

UCI datasets

データ分析の勉強をするときに便利なUCI datasets https://archive.ics.uci.edu/ml/datasets.html Related posts:Mahout環境構築デ …

no image

会社を変える分析の力

ユーザに関する問題 不確実性 過剰期待 事前期待 分析モデルの利用 パターン 変数の数 分析の利用 予測 判別 グループ 検知 最適化 発見 探索 データ分析の必要性 なぜ誤差がでるのか Costは …

no image

kaggle Titanic Tutorial – 3

DecitionTreeのパラメータを調整する。 まずはMaxDepthから from sklearn.model_selection import LeaveOneOut from sklearn. …

no image

Pythonではじめる機械学習 – 多様体学習

多様体学習 次元削減に利用できる手法として主成分分析がある。これは柔軟であり、すぐに実装可能な次元削減アルゴリズムの一つである。しかし一つだけ問題がある。それは主成分分析に適用できるデータは線形のみで …

2013年12月
« 11月   1月 »
 1
2345678
9101112131415
16171819202122
23242526272829
3031  

side bar top



アーカイブ

カテゴリー