科学の箱

科学・IT・登山の話題

機械学習

dataanalysis-002-week1

投稿日:2013年12月9日 更新日:

Rstudioを開発に使う

  • 開発が用意
  • Forumがある
  • 標準
  • フリー

Help

  • R Mailling list
  • Stackoverflow
  • CrossValidated

R-Help

  • ?rnorm
  • args(rnorm)
  • rnorm

Rで的確なサポートを受けるために

  • 回答がほしい質問は何か
  • どんなツールを使っているか
  • 予期していたのは何か
  • 何が得られたか
  • 他にworkaroundは

Dataとはなにか

  • 集合に含まれる変数の値、定量もしくは定性。

値の表現方法

  • H1, W1
  • X11, X12
  • Y

ランダム値

  • 正規分布から取得された値
  • 正規分布のパラメータは平均と分散
  • 正規分布における大事な値 期待値、分散、標準偏差
  • 条件付け x | μ   Xは条件μにおけるランダム値

分布の種類

  • 二項分布
  • 正規分布
  • 一様分布

DataAnalysisで解決する問題

  • Descriptive
  • Exploratory
    • 変数間に関係があることがわかればよい、主なツールはチャート
  • Infer
  • Predictive
    • Exploratoryで明らかになった関連がある変数について回帰分析を行う
  • Causal
  • Machine

Vector, List, matrices, data frameの違い

  • vector: 同じクラスの複数の値
  • list: 異なるクラスの複数の値
  • matrices: 同じクラスで多次元
  • data frmae: 異なるクラスで同じ長さ

メタ情報

inarticle



メタ情報

inarticle



-機械学習
-,

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

スパムメールの判別に使うベイズ定理についてまとめる

分類問題 スパムメールを判別するような問題は一般的に「分類問題」として機械学習では取り扱う。分類問題とはいまある「物」や「発生した事柄」を確率的に分類する。この「確率的」という言葉がみそであり、固定さ …

no image

conjoint分析の資料

マニュアル conjointパッケージ caFactorialDesign Rでconjointパッケージを利用した例 Rでコンジョイント分析 Rでコンジョイント分析 |極めて個人的なメモ コンジョイ …

no image

Pythonではじめる機械学習 – Chap03

3.1 Types of Unsupervised Learning 教師なし学習の例 次元削減: 重要な特徴量のみを使って元のデータを表現する トピック抽出: データを構成する部品を見つける クラス …

no image

データ分析のメモ

一変量解析 各変数についてsummaryをとり、平均値、分散を確認する。変数について尺度を確認してどのように分析を進めるかを考える。 度数分布を作成して値の分布をみてみる。正規分布の値であればいろいろ …

no image

DictVectorizerを使ってカテゴリデータについて特徴抽出をする

都市における温度データを考える。 measure = [ {‘city’: ‘Dubai’, ‘temperature’: 33.}, {‘city’: ‘London’, ‘temperature’ …

2013年12月
« 11月   1月 »
 1
2345678
9101112131415
16171819202122
23242526272829
3031  

side bar top



アーカイブ

カテゴリー