科学の箱

科学・IT・登山の話題

機械学習

スピアマンの順位相関

投稿日:

スピアマンの順位相関を利用して県のデータを使った相関係数を出してみる。

持家普及率を自動車普及率のランキングは、土地がせまいほど低く、有効な土地が広いほど高くなるために順位相関があると考えられる。

持家普及率のデータはこちらから取得した。

自動車普及率は同じサイトのこちらからである。

エクセルによる分析

エクセル上で持家普及率と自動車普及率をまとめた表を作成する。下記はその抜粋である。

excel_data

カラムEには順位を掛け合わせた値を入力する。

E1 = A1 * C1

スピアマンの相関係数を計算する。

spearman_template

Rによる分析

> data<-read.csv("data.csv")
> head(data)
     pre home car
1 愛知県   41  32
2 愛媛県   31  34
3 茨城県   15  12
4 岡山県   26  15
5 沖縄県   46  38
6 岩手県   12  23

> cor.test(data$home, data$car, method="spearman")

        Spearman's rank correlation rho

data:  data$home and data$car 
S = 3906, p-value < 2.2e-16
alternative hypothesis: true rho is not equal to 0 
sample estimates:
      rho 
0.7741674

data

メタ情報

inarticle



メタ情報

inarticle



-機械学習

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

スパムメールの判別に使うベイズ定理についてまとめる

分類問題 スパムメールを判別するような問題は一般的に「分類問題」として機械学習では取り扱う。分類問題とはいまある「物」や「発生した事柄」を確率的に分類する。この「確率的」という言葉がみそであり、固定さ …

no image

Excelによる単回帰分析

エクセルでの単回帰分析をについて手順をまとめる。エクセルの使い方にあわせて分析結果の解釈の仕方も書いておく。 データは勉強時間に対する点数とする。これは作ったデータであるが、線形回帰にフィットするよう …

no image

線形解析の基本手順

線形解析の基本手順 データの読み込み データフォーマット確認 EDA データクレンジング トレーニングデータ構築 モデル構築 モデル評価 予想 メトリック Related posts:Core Con …

no image

DictVectorizerを使ってカテゴリデータについて特徴抽出をする

都市における温度データを考える。 measure = [ {‘city’: ‘Dubai’, ‘temperature’: 33.}, {‘city’: ‘London’, ‘temperature’ …

no image

ラテン方格

ラテン方格は1~nまでの数字についてn x nの正方行列に一回だけ現れるように並べたものである。ラテン方格を利用して実験の割り付けを行う実験計画法がラテン方格法である。 ラテン方格法と似た実験計画法に …

2014年1月
« 12月   2月 »
 12345
6789101112
13141516171819
20212223242526
2728293031  

side bar top



アーカイブ

カテゴリー