科学・IＴ・登山の話題

仕事で始める機械学習 – 2.機械学習で何ができるか – 分類 – ロジスティック回帰

投稿日：2019年11月13日

ロジスティック回帰

確率を得るために

パーセプトロンの判別式により確率をとることはできない。パーセプトロンのヒンジ損失は正負のみを判断し、間違っている場合だけパラメータの更新をする。つまりぎりぎりで正解となったとしても考慮されない。またあらゆる値をとりうるために0～1となる確率は合わない。そのためにロジスティック回帰ではパーセプトロンとは異なる活性化関数と誤差関数を利用する。

シグモイド関数

実数を0～1に押し込める関数＝シグモイド関数

尤度関数から交差エントロピー誤差関数

もっともふさわしいパラメータwを推定するための関数。これは各データが正解ラベルになる条件確率をすべて掛け合わす関数である。尤度関数が最も大きくなる重みwを探す。尤度関数は掛け算であり計算が面倒くさいので対数化する。さらに最小値を求める計算にするために記号を反転する。これを交差エントロピー誤差関数と呼ぶ。

正則化

データの損失があっても、低い重みのほうが評価が高くなる（目的関数が低くなる）。

w = -10 ～ +30
損失関数 = 0.5*(w-20)^2 + 20
正則 = w^2

正則化が弱いとすべてのパラメータがモデルに組み込まれるので過学習を起こす。この結果としてすべての訓練データを通るような曲線を生成するモデルになる。それに対して正則化が強すぎるとパラメータの重みが0に近くなってしまうために直線に近づいてくる。

Related posts:

データサイエンス超入門

スピアマンの順位相関

データ取り込み後に確認すること

執筆者：admin

comment コメントをキャンセル

関連記事

: Pythonではじめる機械学習 – Chap05 – Model Evaluation and Improvement

Chapter 5. Model Evaluation and Improvement 学習モデルの評価定量的なモデルの評価は教師付きモデルが主になる。教師なしモデルは定性的なアプローチで評価する …

: 実践ワークショップExcel徹底活用ビジネスデータ分析

メモ相関係数の行列で傾向が似ている変数を探すことができる。例えば過去データとして商品A,B,C,D,E,Fがあるとする。今商品Xを開発し、マーケティング方法を決めたい。この時A～Fについてはすでに売 …

: 数値項目の分析テンプレート

数値フィールド1 数値フィールド1 rate – 1 rate – 2 データ型算術平均中央値分散トップ3 ボトム3 足切時系列分析層別候補ヒストグラムカウント …

: 仕事で始める機械学習 – 2.機械学習で何ができるか – 分類 – SVM

SVMの決定境界 SVMの決定境界はSVMで利用するカーネルにより異なる。線形カーネル→線形 RBFカーネル→非線形損失関数損失関数としてはヒンジ関数を利用するが、パーセプトロンとは異なり、横軸 …

: 仕事で始める機械学習 – 1. 機械学習プロジェクトの始め方

機械学習プロジェクトの流れ問題の定式化機械学習を利用しない方法システム設計アルゴリズム選定特徴量・教師データ・ログの設計前処理学習・パラメータチューニングシステム統合問題の定式化目 …

PREV: 仕事で始める機械学習 - 2.機械学習で何ができるか - 分類 - パーセプトロン
NEXT: 仕事で始める機械学習 - 2.機械学習で何ができるか - 分類 - SVM

GIMPでForeground color pickerが正しくない色をピックアップするときの対応方法 2021年9月7日
lerpとslerpの違い 2021年8月5日
シェーダーとは 2021年8月3日
Unityの座標系についてメモ 2021年7月1日
ALLとREMOVEFILTERSの違い 2021年6月28日