科学の箱

科学・IT・登山の話題

R 機械学習

ジニ係数(再掲)

投稿日:2014年5月15日 更新日:

ジニ係数について修正した。とりあえずコード。

revenue<-read.csv(file="data.csv", head=TRUE)
revenue$TotalRevenues_n <- as.numeric(gsub(pattern = ",", replacement = "", x = revenue$TotalRevenues, fixed = TRUE))
head(revenue)
class(revenue$TotalRevenues_n)
ineq(revenue$TotalRevenues_n, type="Gini")
plot(Lc(revenue$TotalRevenues_n), col="red", lwd=2)

ロレンツカーブ

lc

 

メタ情報

inarticle



メタ情報

inarticle



-R, 機械学習
-

執筆者:


  1. foo-bar-baz より:

    詰めが甘いですね。
    plot(Lc(revenue$TotalRevenues), col=”red”, lwd=2)
    ではなく,
    plot(Lc(revenue$TotalRevenues_n), col=”red”, lwd=2)
    ですね。

  2. admin より:

    ありがとうございます。確かに0.3と0.5だと形が明らかに違いました。

comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

データ分析の基本と業務

開発生産性は調和平均で計算する。 安全性の在庫の計算には正規分布を利用できる。 標準偏差=5であることを利用すると何が言えるか。 Z=1.96で95%をカバーする。 よって 5 x 1.96でほぼ10 …

no image

Core Concept in Data Analysis – Week 2

1D analysis summary ヒストグラム ヒストグラムのタイプ:gaussian/power law 中心極限定理 確率分布 ブートストラップによる検証 gaussian 測定誤差もしくは …

no image

分散分析のcase study

分散分析についてcase studyをしてみる。目的はRで分散分析を実行する際の手順を明確にすること、およびそれに付随するRの関数を理解することである。 目標として以下をあげておく テストデータを含め …

no image

Rでのラインの表示

Rでラインを引くために関数がいくつか用意されている。 abline() 画像全体に線を引く segments() 始点と終点を指定してその間に線を引く points() “点” …

no image

pythonのデータ分析ライブラリで遊んでみる。

こちらを参考にしてPythonのデータ分析用のライブラリをそろえてみた。 まずはお手軽にヒストグラムを書いてみる。コマンドラインからipythonを立ち上げる。 ipython –pylab &#8 …

2014年5月
« 4月   6月 »
 1234
567891011
12131415161718
19202122232425
262728293031  

side bar top



アーカイブ

カテゴリー