科学の箱

科学・IT・登山の話題

機械学習

Core Concept in Data Analysis – Week 2

投稿日:

1D analysis summary

  • ヒストグラム
  • ヒストグラムのタイプ:gaussian/power law
  • 中心極限定理
  • 確率分布
  • ブートストラップによる検証

gaussian

  • 測定誤差もしくはそれに似た影響があるときに結果の値にランダムに作用する。

power

  • 人による努力はこの形状をとることがおおい。ロングテールと似ている。
  • マシュー効果 http://ideas.time.com/2012/09/26/why-third-grade-is-so-important-the-matthew-effect/
  • この形状になるためにはあらかじめ選択された値が次に選択されるときに影響があることを意味する。

統計とデータ分析の違い

  • 統計:  ランダムな変数, 確率分布, モデルのパラメータを明らかにする。
  • データ分析: 横軸が観察、縦軸が観察の結果, テーブル, パターン→知識

データの特徴をつかむ

  • 真ん中と広がり

ミンコフスキー距離 https://sites.google.com/site/shunsnotes/lei-shi-du-ji-suan-calculation-of-degree-of-similarity/minkofusuki-ju-li-minkowski-distance

 

ブートストラップによる検証 <-> 正規分布による検証

メタ情報

inarticle



メタ情報

inarticle



-機械学習
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

クラスタリング

Rによるクラスタ分析の実行 県別の持家率と自家用車普及率からクラスタ分析を実行し似た県を探してみる。。 データソース 持家と自家用車普及率のデータは下記から取得する 持家普及率のデータはこちらから取得 …

no image

irisをナイーブベイズで分類

ナイーブベイズの概要 ナイーブベイズは教師ありの分類アルゴリズムの一つである。 計算アルゴリズムとしてはベイズ定理を用いている。 機械学習における特徴としてはいかがある 実装が簡単であり、複雑なハイパ …

no image

回帰と分類の違い

回帰と分類は両方とも”予測”問題である。予測とは従属変数から目的変数を明らかにする。この目的変数の種類により回帰と分類に分けられる。 回帰では連続した数値を予測する。例えば株価 …

no image

dataanalysis-002-week2

Structure of Data Analysis 質問を定義する 理想的なデータセットの定義 アクセスできるデータの検索 データの取得 クレンジング Exploratory 統計的予測・モデリング …

no image

tracertの分析

tracertを繰り返し実行した結果を分析し、経路上のホストについてどの程度時間がかかっているかを分析してみる。 tracertの結果は以下のように取得される。 $ tracert www.googl …

2014年6月
« 5月   7月 »
 1
2345678
9101112131415
16171819202122
23242526272829
30  

side bar top



アーカイブ

カテゴリー