1D analysis summary
- ヒストグラム
- ヒストグラムのタイプ:gaussian/power law
- 中心極限定理
- 確率分布
- ブートストラップによる検証
gaussian
- 測定誤差もしくはそれに似た影響があるときに結果の値にランダムに作用する。
power
- 人による努力はこの形状をとることがおおい。ロングテールと似ている。
- マシュー効果 http://ideas.time.com/2012/09/26/why-third-grade-is-so-important-the-matthew-effect/
- この形状になるためにはあらかじめ選択された値が次に選択されるときに影響があることを意味する。
統計とデータ分析の違い
- 統計: ランダムな変数, 確率分布, モデルのパラメータを明らかにする。
- データ分析: 横軸が観察、縦軸が観察の結果, テーブル, パターン→知識
データの特徴をつかむ
- 真ん中と広がり
ミンコフスキー距離 https://sites.google.com/site/shunsnotes/lei-shi-du-ji-suan-calculation-of-degree-of-similarity/minkofusuki-ju-li-minkowski-distance
ブートストラップによる検証 <-> 正規分布による検証