科学の箱

科学・IT・登山の話題

機械学習

データ分析の基本と業務

投稿日:

開発生産性は調和平均で計算する。

安全性の在庫の計算には正規分布を利用できる。

標準偏差=5であることを利用すると何が言えるか。

  • Z=1.96で95%をカバーする。
  • よって 5 x 1.96でほぼ10で95%をカバーする

相関をとらえる方法

  • 散布図
  • バブルチャート

ボックスプロットは何に使えるか。

  • 相反する値
  • boolean

相関を知る

  • プロット
  • 相関係数
    • recommendに使える
  • 回帰分析
    • 価格弾力性

期間分析

  • Zチャート
  • 平滑
  • 移動平均
  • GCAR
  • ファンチャート

売り上げにおける多次元分析

  • 売上→製品別→チャネル別
  • 売り上げ見込み→確度→次元

顧客 RFM分析→マーケティングアプローチ(4P)

主成分分析により変数を減らす

データマインニング

  • アソシエーション
  • シーケンス
  • クラスタ
  • デシジョンツリー

PDCAにおけるBIの利用

  • P: 計画の根拠や予算の積み上げ
  • D: 売上、利益、コスト、比較問題の発見
  • C: Dをさらに掘り下げる、要因→仮説→検証

データ分析の基本と業務 (仕組みが見えるゼロからわかる)

新品価格
¥2,394から
(2013/12/18 14:29時点)

メタ情報

inarticle



メタ情報

inarticle



-機械学習

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

スピアマンの順位相関

スピアマンの順位相関を利用して県のデータを使った相関係数を出してみる。 持家普及率を自動車普及率のランキングは、土地がせまいほど低く、有効な土地が広いほど高くなるために順位相関があると考えられる。 持 …

no image

回帰と分類の違い

回帰と分類は両方とも”予測”問題である。予測とは従属変数から目的変数を明らかにする。この目的変数の種類により回帰と分類に分けられる。 回帰では連続した数値を予測する。例えば株価 …

no image

Exploratory Data Analysis

データを取得した後にやることは、データの構造化とクレンジング。それが完了したらData Exploratory Analysisに入る。 Exloratory Data Analysis(EDA)に関 …

no image

pythonでEDAを実施する – 記述統計

データを取り込む data frameに変換する desdribe()メソッドで要約統計量を出力 各項目について残差分析(ここでは各データが平均値からどの程度離れているか、要するに分散の傾向を把握する …

no image

線形回帰とリッジ回帰とラッソ回帰の違い

用語 線形回帰 データから平均二乗誤差を最低にするパラメータΘを求めて、直線で回帰すること $$ y = Θ_0 + Θ_1 \times x $$ コスト関数 損失関数とも呼ばれる。実際のデータと予 …

2013年12月
« 11月   1月 »
 1
2345678
9101112131415
16171819202122
23242526272829
3031  

side bar top



アーカイブ

カテゴリー