科学の箱

科学・IT・登山の話題

機械学習

Core Concept in Data Analysis – Week 2

投稿日:

1D analysis summary

  • ヒストグラム
  • ヒストグラムのタイプ:gaussian/power law
  • 中心極限定理
  • 確率分布
  • ブートストラップによる検証

gaussian

  • 測定誤差もしくはそれに似た影響があるときに結果の値にランダムに作用する。

power

  • 人による努力はこの形状をとることがおおい。ロングテールと似ている。
  • マシュー効果 http://ideas.time.com/2012/09/26/why-third-grade-is-so-important-the-matthew-effect/
  • この形状になるためにはあらかじめ選択された値が次に選択されるときに影響があることを意味する。

統計とデータ分析の違い

  • 統計:  ランダムな変数, 確率分布, モデルのパラメータを明らかにする。
  • データ分析: 横軸が観察、縦軸が観察の結果, テーブル, パターン→知識

データの特徴をつかむ

  • 真ん中と広がり

ミンコフスキー距離 https://sites.google.com/site/shunsnotes/lei-shi-du-ji-suan-calculation-of-degree-of-similarity/minkofusuki-ju-li-minkowski-distance

 

ブートストラップによる検証 <-> 正規分布による検証

メタ情報

inarticle



メタ情報

inarticle



-機械学習
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

Core Concept in Data Analysis – Week 3

2d Analsysis 分布図 相関 回帰分析 因果関係 ガルトンはダーウィンのいとこ Related posts:R Dataset – AirPassengers前向き研究と後ろ向き研究SIGN …

no image

ジニ係数(再掲)

ジニ係数について修正した。とりあえずコード。 revenue<-read.csv(file=”data.csv”, head=TRUE) revenue$TotalRevenues_n < …

no image

仕事で始める機械学習 – 4章 システムに機械学習を組み込む

機械学習アーキテクチャ 学習方法としては3つのパターンがある バッチ処理で一括学習 バッチ処理で逐次学習 リアルタイムで逐次学習 学習と予測パターンの提供方法としては4つのパターンがある バッチ学習- …

no image

仕事で始める機械学習 – 2.機械学習で何ができるか – 分類 – SVM

SVMの決定境界 SVMの決定境界はSVMで利用するカーネルにより異なる。 線形カーネル→線形 RBFカーネル→非線形 損失関数 損失関数としてはヒンジ関数を利用するが、パーセプトロンとは異なり、横軸 …

no image

モンベルダウンジャケットについて売れ筋商品を分析してみる。

幾何平均が値付けに利用されているという話を聞いたので実際の商品を例にして分析してみる。 調査の目的 適切なダウンジャケットを選ぶことで冬季にあるいは夏季の3000m級の高山で気持ちよく過ご巣ことができ …

2014年6月
« 5月   7月 »
 1
2345678
9101112131415
16171819202122
23242526272829
30  

side bar top



アーカイブ

カテゴリー