- データを取り込む
- data frameに変換する
- desdribe()メソッドで要約統計量を出力
- 各項目について残差分析(ここでは各データが平均値からどの程度離れているか、要するに分散の傾向を把握する、χ2の残差分析ではない)
- 各項目について例外値分析
- カテゴラルデータはグループごとに集計(件数が多い値、少ない値について見てみる)
- 時系列データは時間ごとの変化をプロット
- regression分析
- ヒストグラムやボックスプロットで比較
科学・IT・登山の話題
投稿日:2018年3月22日 更新日:
執筆者:admin
関連記事
多様体学習 次元削減に利用できる手法として主成分分析がある。これは柔軟であり、すぐに実装可能な次元削減アルゴリズムの一つである。しかし一つだけ問題がある。それは主成分分析に適用できるデータは線形のみで …
データの説明 261人の子供たちから得られた年齢別骨密度。 フォーマット idnum: 識別コード age: 測定時の年齢 gender: 性別 spnbmd: 骨密度 チェック テーブル全体について …
Core Concept in Data Analysis – Week 2
1D analysis summary ヒストグラム ヒストグラムのタイプ:gaussian/power law 中心極限定理 確率分布 ブートストラップによる検証 gaussian 測定誤差もしくは …