科学の箱

科学・IT・登山の話題

機械学習

Core Concept in Data Analysis – Week 1

投稿日:

パート

  • Data Mining
  • Core Analysis
  • Visualization
  • Illustrate

Data Mining

  • data mining = patterns in data + data base + knowledge discovery
  • core data analysis = patterns in data + knowledge discovery

Pattern found

  • success if compatible with existing knowledge
  • failure if not compatible with existing knowledge

Data analysis: find pattern -> interpret with knowledge -> care not if patterns is compatible with current knowledge.

Core Analysis の4つのパターン

  • 要約 – 定量データ – PCA
  • 要約 – 質的データ – クラスタ
  • 相関 – 定量データ – 回帰
  • 相関 – 質的データ – 分類

他のデータ分析アプローチとの比較

  • 古典的統計: データは数学的にモデルに適合するかを検証するテストにのみ使われる。
  • ML : データから予測するためのルールを作る
  • Data Mining: データベースからパターンを見つけ、新しい知識をふやす。

Visualization

  • Highlight
  • 統合
  • データの操作

 

メタ情報

inarticle



メタ情報

inarticle



-機械学習
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

手書き数字データについて次元縮約および教師ありモデルの構築

前回手書き数字データについてイメージで確認した結果、人の目で確認する分には区別ができる。では機械学習ではどのように実施していくのか。 今回は以下の内容について説明する。 多様体学習による次元縮約 ナイ …

no image

dataanalysis-002-week4

クラスタリング SVDと組み合わせることでよりクラスに分かれているクラスタリングを実行できる。 散布図でクラスタリングする変数を探す クラスタリング SVDを実行する SVDの結果をクラスタリングに取 …

no image

make_blobsで分類データを作成する

sklearnで分類学習モデルを構築する際にテストデータが必要になる。手で作成したりあらかじめ用意されたデータを使うこともできるが、make_blobsを使ってランダムデータを作成できる。 sklea …

no image

多変量解析

多変量解析の分類 回帰分析 ロジスティック分析 判別分析 主成分分析 因子分析 共分散 クラスタリング 共分散 Sxy = Σ(Xi – X~)(Yi – Y~) / n 共分 …

no image

前向き研究と後ろ向き研究

前向き研究と後ろ向き研究は疫学における用語である。 前向き研究で使われる研究手法にはコホートや無作為比較対照研究、ロジスティック分析がある。これらの研究ではサンプルをリスクファクター(危険要因)のある …

2014年6月
« 5月   7月 »
 1
2345678
9101112131415
16171819202122
23242526272829
30  

side bar top



アーカイブ

カテゴリー