科学の箱

科学・IT・登山の話題

機械学習

Core Concept in Data Analysis – Week 1

投稿日:

パート

  • Data Mining
  • Core Analysis
  • Visualization
  • Illustrate

Data Mining

  • data mining = patterns in data + data base + knowledge discovery
  • core data analysis = patterns in data + knowledge discovery

Pattern found

  • success if compatible with existing knowledge
  • failure if not compatible with existing knowledge

Data analysis: find pattern -> interpret with knowledge -> care not if patterns is compatible with current knowledge.

Core Analysis の4つのパターン

  • 要約 – 定量データ – PCA
  • 要約 – 質的データ – クラスタ
  • 相関 – 定量データ – 回帰
  • 相関 – 質的データ – 分類

他のデータ分析アプローチとの比較

  • 古典的統計: データは数学的にモデルに適合するかを検証するテストにのみ使われる。
  • ML : データから予測するためのルールを作る
  • Data Mining: データベースからパターンを見つけ、新しい知識をふやす。

Visualization

  • Highlight
  • 統合
  • データの操作

 

メタ情報

inarticle



メタ情報

inarticle



-機械学習
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

dataanalysis-002-week5

ANOVA – quantitative 分散分析、数学的に分散分析と重回帰分析は同じ 分散分析では3群以上の平均の差異を検定する ただし非線形では異なる http://oshiete.g …

no image

ジニ係数(再掲)

ジニ係数について修正した。とりあえずコード。 revenue<-read.csv(file=”data.csv”, head=TRUE) revenue$TotalRevenues_n < …

no image

Pythonではじめる機械学習 – Chap04

4.4 Binning, Discretization, Linear Models, and Trees ビン化のメリット 決定木でビン化するメリットはあまりない 決定木はモデルの中で一つの特徴につ …

no image

conjoint分析の資料

マニュアル conjointパッケージ caFactorialDesign Rでconjointパッケージを利用した例 Rでコンジョイント分析 Rでコンジョイント分析 |極めて個人的なメモ コンジョイ …

no image

Core Concept in Data Analysis – Week 5

予測の分析 関連性を分析する モデルを明らかにする。 パラメータを推測する。 テストする。 予測が将来になると難しい→環境が変わってしまうため。 correlation structure (質的尺度 …

2014年6月
« 5月   7月 »
 1
2345678
9101112131415
16171819202122
23242526272829
30  

side bar top



アーカイブ

カテゴリー