科学の箱

科学・IT・登山の話題

機械学習

Core Concept in Data Analysis – Week 2

投稿日:

1D analysis summary

  • ヒストグラム
  • ヒストグラムのタイプ:gaussian/power law
  • 中心極限定理
  • 確率分布
  • ブートストラップによる検証

gaussian

  • 測定誤差もしくはそれに似た影響があるときに結果の値にランダムに作用する。

power

  • 人による努力はこの形状をとることがおおい。ロングテールと似ている。
  • マシュー効果 http://ideas.time.com/2012/09/26/why-third-grade-is-so-important-the-matthew-effect/
  • この形状になるためにはあらかじめ選択された値が次に選択されるときに影響があることを意味する。

統計とデータ分析の違い

  • 統計:  ランダムな変数, 確率分布, モデルのパラメータを明らかにする。
  • データ分析: 横軸が観察、縦軸が観察の結果, テーブル, パターン→知識

データの特徴をつかむ

  • 真ん中と広がり

ミンコフスキー距離 https://sites.google.com/site/shunsnotes/lei-shi-du-ji-suan-calculation-of-degree-of-similarity/minkofusuki-ju-li-minkowski-distance

 

ブートストラップによる検証 <-> 正規分布による検証

メタ情報

inarticle



メタ情報

inarticle



-機械学習
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

データ分析について評価する

デザイン コントロールグループはあるか モデル 検定の前提は満たしているか(正規分布) 従属変数の尺度は適切か(名義、順序、間隔、比率) 独立変数の数は適切か モデルについて説明できるか(独立変数の数 …

no image

仕事で始める機械学習 – 2.機械学習で何ができるか – 分類 – SVM

SVMの決定境界 SVMの決定境界はSVMで利用するカーネルにより異なる。 線形カーネル→線形 RBFカーネル→非線形 損失関数 損失関数としてはヒンジ関数を利用するが、パーセプトロンとは異なり、横軸 …

no image

ラテン方格

ラテン方格は1~nまでの数字についてn x nの正方行列に一回だけ現れるように並べたものである。ラテン方格を利用して実験の割り付けを行う実験計画法がラテン方格法である。 ラテン方格法と似た実験計画法に …

no image

conjoint分析の資料

マニュアル conjointパッケージ caFactorialDesign Rでconjointパッケージを利用した例 Rでコンジョイント分析 Rでコンジョイント分析 |極めて個人的なメモ コンジョイ …

no image

Core Concept in Data Analysis – Week 3

2d Analsysis 分布図 相関 回帰分析 因果関係 ガルトンはダーウィンのいとこ Related posts:dataanalysis-002-week2前向き研究と後ろ向き研究ウェブ分析をハ …

2014年6月
« 5月   7月 »
 1
2345678
9101112131415
16171819202122
23242526272829
30  

side bar top



アーカイブ

カテゴリー