科学の箱

科学・IT・登山の話題

機械学習

Core Concept in Data Analysis – Week 2

投稿日:

1D analysis summary

  • ヒストグラム
  • ヒストグラムのタイプ:gaussian/power law
  • 中心極限定理
  • 確率分布
  • ブートストラップによる検証

gaussian

  • 測定誤差もしくはそれに似た影響があるときに結果の値にランダムに作用する。

power

  • 人による努力はこの形状をとることがおおい。ロングテールと似ている。
  • マシュー効果 http://ideas.time.com/2012/09/26/why-third-grade-is-so-important-the-matthew-effect/
  • この形状になるためにはあらかじめ選択された値が次に選択されるときに影響があることを意味する。

統計とデータ分析の違い

  • 統計:  ランダムな変数, 確率分布, モデルのパラメータを明らかにする。
  • データ分析: 横軸が観察、縦軸が観察の結果, テーブル, パターン→知識

データの特徴をつかむ

  • 真ん中と広がり

ミンコフスキー距離 https://sites.google.com/site/shunsnotes/lei-shi-du-ji-suan-calculation-of-degree-of-similarity/minkofusuki-ju-li-minkowski-distance

 

ブートストラップによる検証 <-> 正規分布による検証

メタ情報

inarticle



メタ情報

inarticle



-機械学習
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

irisをナイーブベイズで分類

ナイーブベイズの概要 ナイーブベイズは教師ありの分類アルゴリズムの一つである。 計算アルゴリズムとしてはベイズ定理を用いている。 機械学習における特徴としてはいかがある 実装が簡単であり、複雑なハイパ …

no image

Statistical Reasoning for Public Health

Module up to 3 SES – 社会経済的地位 Cognitive function – 認知機能 The authors used the graphic alon …

no image

dataanalysis-002-week3

exploratory analysis グラフの目的 データのおおよそを理解する パターンを探す モデリングを探す デバッグ コミュニケーション boxplot 値のレンジを確認する 他の値とレンジ …

no image

スパムメールの判別に使うベイズ定理についてまとめる

分類問題 スパムメールを判別するような問題は一般的に「分類問題」として機械学習では取り扱う。分類問題とはいまある「物」や「発生した事柄」を確率的に分類する。この「確率的」という言葉がみそであり、固定さ …

no image

データ取り込み後に確認すること

# tidyデータの原則 # 1カラム = 1変数 # 1行 = 1観察 # 1テーブル = 1 unique key # foreign key to link # テーブル全体で見ること # カラ …

2014年6月
« 5月   7月 »
 1
2345678
9101112131415
16171819202122
23242526272829
30  

side bar top



アーカイブ

カテゴリー