科学の箱

科学・IT・登山の話題

機械学習

データ分析の基本と業務

投稿日:

開発生産性は調和平均で計算する。

安全性の在庫の計算には正規分布を利用できる。

標準偏差=5であることを利用すると何が言えるか。

  • Z=1.96で95%をカバーする。
  • よって 5 x 1.96でほぼ10で95%をカバーする

相関をとらえる方法

  • 散布図
  • バブルチャート

ボックスプロットは何に使えるか。

  • 相反する値
  • boolean

相関を知る

  • プロット
  • 相関係数
    • recommendに使える
  • 回帰分析
    • 価格弾力性

期間分析

  • Zチャート
  • 平滑
  • 移動平均
  • GCAR
  • ファンチャート

売り上げにおける多次元分析

  • 売上→製品別→チャネル別
  • 売り上げ見込み→確度→次元

顧客 RFM分析→マーケティングアプローチ(4P)

主成分分析により変数を減らす

データマインニング

  • アソシエーション
  • シーケンス
  • クラスタ
  • デシジョンツリー

PDCAにおけるBIの利用

  • P: 計画の根拠や予算の積み上げ
  • D: 売上、利益、コスト、比較問題の発見
  • C: Dをさらに掘り下げる、要因→仮説→検証

データ分析の基本と業務 (仕組みが見えるゼロからわかる)

新品価格
¥2,394から
(2013/12/18 14:29時点)

メタ情報

inarticle



メタ情報

inarticle



-機械学習

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

仕事で始める機械学習 – 1. 機械学習プロジェクトの始め方

機械学習プロジェクトの流れ 問題の定式化 機械学習を利用しない方法 システム設計 アルゴリズム選定 特徴量・教師データ・ログの設計 前処理 学習・パラメータチューニング システム統合 問題の定式化 目 …

no image

線形解析の基本手順

線形解析の基本手順 データの読み込み データフォーマット確認 EDA データクレンジング トレーニングデータ構築 モデル構築 モデル評価 予想 メトリック Related posts:Mahout環境 …

no image

条件付きでレコードを取得する

データフレームでは条件付きでレコードを取得できる。 以下のようなフォーマットのデータフレームを考える id name height vector1 <- c(1, 2, 3, 4, 5) vec …

no image

スパムメールの判別に使うベイズ定理についてまとめる

分類問題 スパムメールを判別するような問題は一般的に「分類問題」として機械学習では取り扱う。分類問題とはいまある「物」や「発生した事柄」を確率的に分類する。この「確率的」という言葉がみそであり、固定さ …

no image

判別式

判別式の手順 散布図をプロットしてみてグループに分けることができるかを検討する 判別式のモデル(線形判別、マハラノビスなど)を検討する データを読み込み判別式テンプレートを作成する 判別式を作成する …

2013年12月
« 11月   1月 »
 1
2345678
9101112131415
16171819202122
23242526272829
3031  

side bar top



アーカイブ

カテゴリー