科学の箱

科学・IT・登山の話題

機械学習

スピアマンの順位相関

投稿日:

スピアマンの順位相関を利用して県のデータを使った相関係数を出してみる。

持家普及率を自動車普及率のランキングは、土地がせまいほど低く、有効な土地が広いほど高くなるために順位相関があると考えられる。

持家普及率のデータはこちらから取得した。

自動車普及率は同じサイトのこちらからである。

エクセルによる分析

エクセル上で持家普及率と自動車普及率をまとめた表を作成する。下記はその抜粋である。

excel_data

カラムEには順位を掛け合わせた値を入力する。

E1 = A1 * C1

スピアマンの相関係数を計算する。

spearman_template

Rによる分析

> data<-read.csv("data.csv")
> head(data)
     pre home car
1 愛知県   41  32
2 愛媛県   31  34
3 茨城県   15  12
4 岡山県   26  15
5 沖縄県   46  38
6 岩手県   12  23

> cor.test(data$home, data$car, method="spearman")

        Spearman's rank correlation rho

data:  data$home and data$car 
S = 3906, p-value < 2.2e-16
alternative hypothesis: true rho is not equal to 0 
sample estimates:
      rho 
0.7741674

data

メタ情報

inarticle



メタ情報

inarticle



-機械学習

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

線形回帰とリッジ回帰とラッソ回帰の違い

用語 線形回帰 データから平均二乗誤差を最低にするパラメータΘを求めて、直線で回帰すること $$ y = Θ_0 + Θ_1 \times x $$ コスト関数 損失関数とも呼ばれる。実際のデータと予 …

no image

モンベルダウンジャケットについて売れ筋商品を分析してみる。

幾何平均が値付けに利用されているという話を聞いたので実際の商品を例にして分析してみる。 調査の目的 適切なダウンジャケットを選ぶことで冬季にあるいは夏季の3000m級の高山で気持ちよく過ご巣ことができ …

no image

research pipeline

Related posts:前向き研究と後ろ向き研究UCI datasetsirisデータについて簡単な機械学習をしてみる

no image

irisデータについて簡単な機械学習をしてみる

irisデータを使って簡単な機械学習をしてみる。 ここで説明している内容は以下になる。 データの読み込み、前処理 トレインデータと検証データへの分割 モデル選定 モデル構築および検証 データの読み込み …

no image

Pythonではじめる機械学習 – Chap04

4.4 Binning, Discretization, Linear Models, and Trees ビン化のメリット 決定木でビン化するメリットはあまりない 決定木はモデルの中で一つの特徴につ …

2014年1月
« 12月   2月 »
 12345
6789101112
13141516171819
20212223242526
2728293031  

side bar top



アーカイブ

カテゴリー