シンプソンのパラドックス
レコメンドエンジン
- コンテンツベースフィルタリング
- 強調
- アイテム
- ユーザー
ビジネスにおけるデータ分析の手順
課題→ビジネスケース→仮説→分析→用途
データ分析の手順
- データソース・前処理
- データ移行・変数抽出・非構造化データの構造化・Exploratory
- Descriptive・モデリング
- 検証
PDCAサイクルへの展開
- P: 展開
- D:ビジネスへの利用
- モデリング
- 補正
ランディングページの分析
Mecabによる形態要素解析
マルコフ連鎖モンテカルロ
データ解析の分類
- 探索的データ解析
- 基準変数ありデータ解析
クラスタリングの問題
- 多重共線性
- 疑似相関←クラスタ内部ランキングにより避ける
おとしあな
- データ garbage in → garbage out
- シンプソンのパラドックス
- 過適合
- 特徴次元空間
- ヒューズの現象
パラメトリック
- パラメトリック: 正規分布を仮定
- ノンパラメトリック: 母集団には何も仮定しない
回帰分析の手順
- データからの予測
- モデル
- 関連する数値
- 目標とする変数
- 勝率・売上個数・在庫
ニューラルネットワーク
- 教師なし
- 教師あり
- 過去 マシンラーニング
- グループ クラスタリング
統計の分類
- 探索・機械学習
- 一般線形
- 一般非線形