科学の箱

科学・IT・登山の話題

機械学習

仕事で始める機械学習 – 2.機械学習で何ができるか – 分類 – SVM

投稿日:

SVMの決定境界

SVMの決定境界はSVMで利用するカーネルにより異なる。

  • 線形カーネル→線形
  • RBFカーネル→非線形

損失関数

損失関数としてはヒンジ関数を利用するが、パーセプトロンとは異なり、横軸と交わる点はf(x)=1である。このずれによりただしく判別されていても、ぎりぎりの場合には、ペナルティを少しだけ与える。

マージン最大化

クラスを分類する平面を超平面と呼ぶ。マージンは超平面から最も近い各クラスのデータへの距離である。このマージンを最大化することによりデータへの遊びが生まれ、過学習を防ぐことができる。

カーネル

データを高次空間に移すことで、線形では分離できないデータも分離できるようになる。代表的なカーネルとしては線形カーネルとRBFカーネルがある。

線形カーネル:線形分離、疎なデータ、例えばテキストデータなどに使われる。高速。

RBFカーネル:非線形分離、密なデータ、例えば音楽データなどに用いられる。

 

メタ情報

inarticle



メタ情報

inarticle



-機械学習

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

実践ワークショップExcel徹底活用ビジネスデータ分析

メモ 相関係数の行列で傾向が似ている変数を探すことができる。例えば過去データとして商品A,B,C,D,E,Fがあるとする。今商品Xを開発し、マーケティング方法を決めたい。この時A~Fについてはすでに売 …

no image

スパムメールの判別に使うベイズ定理についてまとめる

分類問題 スパムメールを判別するような問題は一般的に「分類問題」として機械学習では取り扱う。分類問題とはいまある「物」や「発生した事柄」を確率的に分類する。この「確率的」という言葉がみそであり、固定さ …

no image

Pythonではじめる機械学習 – KDE

カーネル密度分布とは カーネル密度分布とは一言でいうと滑らかなヒストグラムであり曲線になっている。標本データから確率密度を計算することにより標本がない部分についても確率密度を計算できる。 例えば犯罪の …

no image

ラテン方格

ラテン方格は1~nまでの数字についてn x nの正方行列に一回だけ現れるように並べたものである。ラテン方格を利用して実験の割り付けを行う実験計画法がラテン方格法である。 ラテン方格法と似た実験計画法に …

no image

Pythonではじめる機械学習 – Chap03

3.1 Types of Unsupervised Learning 教師なし学習の例 次元削減: 重要な特徴量のみを使って元のデータを表現する トピック抽出: データを構成する部品を見つける クラス …

2019年11月
« 10月   12月 »
 123
45678910
11121314151617
18192021222324
252627282930  

side bar top



アーカイブ

カテゴリー