科学の箱

科学・IT・登山の話題

R 機械学習

ジニ係数(再掲)

投稿日:2014年5月15日 更新日:

ジニ係数について修正した。とりあえずコード。

revenue<-read.csv(file="data.csv", head=TRUE)
revenue$TotalRevenues_n <- as.numeric(gsub(pattern = ",", replacement = "", x = revenue$TotalRevenues, fixed = TRUE))
head(revenue)
class(revenue$TotalRevenues_n)
ineq(revenue$TotalRevenues_n, type="Gini")
plot(Lc(revenue$TotalRevenues_n), col="red", lwd=2)

ロレンツカーブ

lc

 

メタ情報

inarticle



メタ情報

inarticle



-R, 機械学習
-

執筆者:


  1. foo-bar-baz より:

    詰めが甘いですね。
    plot(Lc(revenue$TotalRevenues), col=”red”, lwd=2)
    ではなく,
    plot(Lc(revenue$TotalRevenues_n), col=”red”, lwd=2)
    ですね。

  2. admin より:

    ありがとうございます。確かに0.3と0.5だと形が明らかに違いました。

comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

Rオブジェクト指向のメモ

whichではwhich.minとwhich.maxが用意されているという指摘を受けたので調べ見てた。 which.minとwhich.maxはRでいうところのオブジェクト指向を利用した構造にみえる。 …

no image

データ分析のメモ

一変量解析 各変数についてsummaryをとり、平均値、分散を確認する。変数について尺度を確認してどのように分析を進めるかを考える。 度数分布を作成して値の分布をみてみる。正規分布の値であればいろいろ …

no image

findFn{sos}

findFn{sos} findFn(string, maxPages = 20, sortby = NULL, verbose = 1, …) 文字列から関数を探すことができる。パッケー …

no image

回帰と分類の違い

回帰と分類は両方とも”予測”問題である。予測とは従属変数から目的変数を明らかにする。この目的変数の種類により回帰と分類に分けられる。 回帰では連続した数値を予測する。例えば株価 …

no image

dataanalysis-002-week4

クラスタリング SVDと組み合わせることでよりクラスに分かれているクラスタリングを実行できる。 散布図でクラスタリングする変数を探す クラスタリング SVDを実行する SVDの結果をクラスタリングに取 …

2014年5月
« 4月   6月 »
 1234
567891011
12131415161718
19202122232425
262728293031  

side bar top



アーカイブ

カテゴリー