パート
- Data Mining
- Core Analysis
- Visualization
- Illustrate
Data Mining
- data mining = patterns in data + data base + knowledge discovery
- core data analysis = patterns in data + knowledge discovery
Pattern found
- success if compatible with existing knowledge
- failure if not compatible with existing knowledge
Data analysis: find pattern -> interpret with knowledge -> care not if patterns is compatible with current knowledge.
Core Analysis の4つのパターン
- 要約 – 定量データ – PCA
- 要約 – 質的データ – クラスタ
- 相関 – 定量データ – 回帰
- 相関 – 質的データ – 分類
他のデータ分析アプローチとの比較
- 古典的統計: データは数学的にモデルに適合するかを検証するテストにのみ使われる。
- ML : データから予測するためのルールを作る
- Data Mining: データベースからパターンを見つけ、新しい知識をふやす。
Visualization
- Highlight
- 統合
- データの操作