科学の箱

科学・IT・登山の話題

R 機械学習

ジニ係数(再掲)

投稿日:2014年5月15日 更新日:

ジニ係数について修正した。とりあえずコード。

revenue<-read.csv(file="data.csv", head=TRUE)
revenue$TotalRevenues_n <- as.numeric(gsub(pattern = ",", replacement = "", x = revenue$TotalRevenues, fixed = TRUE))
head(revenue)
class(revenue$TotalRevenues_n)
ineq(revenue$TotalRevenues_n, type="Gini")
plot(Lc(revenue$TotalRevenues_n), col="red", lwd=2)

ロレンツカーブ

lc

 

メタ情報

inarticle



メタ情報

inarticle



-R, 機械学習
-

執筆者:


  1. foo-bar-baz より:

    詰めが甘いですね。
    plot(Lc(revenue$TotalRevenues), col=”red”, lwd=2)
    ではなく,
    plot(Lc(revenue$TotalRevenues_n), col=”red”, lwd=2)
    ですね。

  2. admin より:

    ありがとうございます。確かに0.3と0.5だと形が明らかに違いました。

comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

Wilcoxonの符号付順位決定

boneのspnbmdを使って年齢別に男女差があるかを確認してみる。検定ではWilcoxonの符号付順位決定を利用する。 boneは特定個人について骨密度を計測している。データにはIDと骨密度以外に性 …

no image

Exploratory Data Analysis

データを取得した後にやることは、データの構造化とクレンジング。それが完了したらData Exploratory Analysisに入る。 Exloratory Data Analysis(EDA)に関 …

no image

前向き研究と後ろ向き研究

前向き研究と後ろ向き研究は疫学における用語である。 前向き研究で使われる研究手法にはコホートや無作為比較対照研究、ロジスティック分析がある。これらの研究ではサンプルをリスクファクター(危険要因)のある …

no image

実践ワークショップExcel徹底活用ビジネスデータ分析

メモ 相関係数の行列で傾向が似ている変数を探すことができる。例えば過去データとして商品A,B,C,D,E,Fがあるとする。今商品Xを開発し、マーケティング方法を決めたい。この時A~Fについてはすでに売 …

no image

oneway.test, aov, anovaの違い-2

さてoneway.test, aov, anovaの違いをもとにしてそれぞれの関数について調べてみる。 機能 advantage disadvantage oneway.test 分散分析 等分散を仮 …

2014年5月
« 4月   6月 »
 1234
567891011
12131415161718
19202122232425
262728293031  

side bar top



アーカイブ

カテゴリー