科学の箱

科学・IT・登山の話題

機械学習

仕事で始める機械学習 – 2.機械学習で何ができるか – 分類 – SVM

投稿日:

SVMの決定境界

SVMの決定境界はSVMで利用するカーネルにより異なる。

  • 線形カーネル→線形
  • RBFカーネル→非線形

損失関数

損失関数としてはヒンジ関数を利用するが、パーセプトロンとは異なり、横軸と交わる点はf(x)=1である。このずれによりただしく判別されていても、ぎりぎりの場合には、ペナルティを少しだけ与える。

マージン最大化

クラスを分類する平面を超平面と呼ぶ。マージンは超平面から最も近い各クラスのデータへの距離である。このマージンを最大化することによりデータへの遊びが生まれ、過学習を防ぐことができる。

カーネル

データを高次空間に移すことで、線形では分離できないデータも分離できるようになる。代表的なカーネルとしては線形カーネルとRBFカーネルがある。

線形カーネル:線形分離、疎なデータ、例えばテキストデータなどに使われる。高速。

RBFカーネル:非線形分離、密なデータ、例えば音楽データなどに用いられる。

 

メタ情報

inarticle



メタ情報

inarticle



-機械学習

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

logistic regressionでの失敗

ロジスティック回帰でデータを分析しようとしたところうまくいかず。どうにもこうにもおかしな値が出るし、他の回帰分析との結果と明らか矛盾している。よくわからないのでとりあえずirisデータを使って手順を追 …

no image

Pythonではじめる機械学習 – Chap02

2.1 Classification and Regression 分類問題の目的 クラスがどのようなラベルであるかを予測 分類問題 2つのクラスに分類するバイナリクラシフィケーション 例)Yes/N …

no image

R Dataset – AirPassengers

データの説明 1949~1960年における月別飛行機搭乗者数 フォーマット このデータは時系列データであることがわかる。 > str(AirPassengers)  Time-Series [1 …

no image

判別式

判別式の手順 散布図をプロットしてみてグループに分けることができるかを検討する 判別式のモデル(線形判別、マハラノビスなど)を検討する データを読み込み判別式テンプレートを作成する 判別式を作成する …

no image

research pipeline

Related posts:判別式Statistical Reasoning for Public HealthCore Concept in Data Analysis – Week 3

2019年11月
« 10月   12月 »
 123
45678910
11121314151617
18192021222324
252627282930  

side bar top



アーカイブ

カテゴリー