科学の箱

科学・IT・登山の話題

R 機械学習

ジニ係数(再掲)

投稿日:2014年5月15日 更新日:

ジニ係数について修正した。とりあえずコード。

revenue<-read.csv(file="data.csv", head=TRUE)
revenue$TotalRevenues_n <- as.numeric(gsub(pattern = ",", replacement = "", x = revenue$TotalRevenues, fixed = TRUE))
head(revenue)
class(revenue$TotalRevenues_n)
ineq(revenue$TotalRevenues_n, type="Gini")
plot(Lc(revenue$TotalRevenues_n), col="red", lwd=2)

ロレンツカーブ

lc

 

メタ情報

inarticle



メタ情報

inarticle



-R, 機械学習
-

執筆者:


  1. foo-bar-baz より:

    詰めが甘いですね。
    plot(Lc(revenue$TotalRevenues), col=”red”, lwd=2)
    ではなく,
    plot(Lc(revenue$TotalRevenues_n), col=”red”, lwd=2)
    ですね。

  2. admin より:

    ありがとうございます。確かに0.3と0.5だと形が明らかに違いました。

comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

スパムメールの判別に使うベイズ定理についてまとめる

分類問題 スパムメールを判別するような問題は一般的に「分類問題」として機械学習では取り扱う。分類問題とはいまある「物」や「発生した事柄」を確率的に分類する。この「確率的」という言葉がみそであり、固定さ …

no image

データフレームで層別に操作をする

Rでデータベースに似たデータを取り扱う際には、データフレームを使うことがおおい。JavaはPHPなどのプログラミング言語では、層別に集計作業をする際にはデータベース上のSQLか、データを読み込んでから …

no image

irisをナイーブベイズで分類

ナイーブベイズの概要 ナイーブベイズは教師ありの分類アルゴリズムの一つである。 計算アルゴリズムとしてはベイズ定理を用いている。 機械学習における特徴としてはいかがある 実装が簡単であり、複雑なハイパ …

no image

仕事で始める機械学習 – 3.学習結果を評価しよう – 指標

主な指標 モデル構築後に確認する主な指標は4つある。 正解率 適合率 再現率 F値 正解率 $$ 正解率 = \frac{TP + TN}{TP+FP+TN+FN} $$ 正解率は全データ数に対する正 …

no image

K近傍法と決定木の比較

One of the most comprehensible non-parametric methods is k-nearest-neighbors: find the points which …

2014年5月
« 4月   6月 »
 1234
567891011
12131415161718
19202122232425
262728293031  

side bar top



アーカイブ

カテゴリー