科学の箱

科学・IT・登山の話題

機械学習

スピアマンの順位相関

投稿日:

スピアマンの順位相関を利用して県のデータを使った相関係数を出してみる。

持家普及率を自動車普及率のランキングは、土地がせまいほど低く、有効な土地が広いほど高くなるために順位相関があると考えられる。

持家普及率のデータはこちらから取得した。

自動車普及率は同じサイトのこちらからである。

エクセルによる分析

エクセル上で持家普及率と自動車普及率をまとめた表を作成する。下記はその抜粋である。

excel_data

カラムEには順位を掛け合わせた値を入力する。

E1 = A1 * C1

スピアマンの相関係数を計算する。

spearman_template

Rによる分析

> data<-read.csv("data.csv")
> head(data)
     pre home car
1 愛知県   41  32
2 愛媛県   31  34
3 茨城県   15  12
4 岡山県   26  15
5 沖縄県   46  38
6 岩手県   12  23

> cor.test(data$home, data$car, method="spearman")

        Spearman's rank correlation rho

data:  data$home and data$car 
S = 3906, p-value < 2.2e-16
alternative hypothesis: true rho is not equal to 0 
sample estimates:
      rho 
0.7741674

data

メタ情報

inarticle



メタ情報

inarticle



-機械学習

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

仕事で始める機械学習 – 4章 システムに機械学習を組み込む

機械学習アーキテクチャ 学習方法としては3つのパターンがある バッチ処理で一括学習 バッチ処理で逐次学習 リアルタイムで逐次学習 学習と予測パターンの提供方法としては4つのパターンがある バッチ学習- …

no image

Pythonではじめる機械学習 – k-Means

k-Meansの概要 k-Meansは教師なし学習の一つであり、あらかじめ指定された数にグループを分ける。 例えば今身長である程度まとまって席に座っている生徒を考えます。k-Meansでは最初に分ける …

no image

手書き数字データについて次元縮約および教師ありモデルの構築

前回手書き数字データについてイメージで確認した結果、人の目で確認する分には区別ができる。では機械学習ではどのように実施していくのか。 今回は以下の内容について説明する。 多様体学習による次元縮約 ナイ …

no image

仕事で始める機械学習 – 3.学習結果を評価しよう – 指標

主な指標 モデル構築後に確認する主な指標は4つある。 正解率 適合率 再現率 F値 正解率 $$ 正解率 = \frac{TP + TN}{TP+FP+TN+FN} $$ 正解率は全データ数に対する正 …

no image

K近傍法と決定木の比較

One of the most comprehensible non-parametric methods is k-nearest-neighbors: find the points which …

2014年1月
« 12月   2月 »
 12345
6789101112
13141516171819
20212223242526
2728293031  

side bar top



アーカイブ

カテゴリー