科学の箱

科学・IT・登山の話題

機械学習

スピアマンの順位相関

投稿日:

スピアマンの順位相関を利用して県のデータを使った相関係数を出してみる。

持家普及率を自動車普及率のランキングは、土地がせまいほど低く、有効な土地が広いほど高くなるために順位相関があると考えられる。

持家普及率のデータはこちらから取得した。

自動車普及率は同じサイトのこちらからである。

エクセルによる分析

エクセル上で持家普及率と自動車普及率をまとめた表を作成する。下記はその抜粋である。

excel_data

カラムEには順位を掛け合わせた値を入力する。

E1 = A1 * C1

スピアマンの相関係数を計算する。

spearman_template

Rによる分析

> data<-read.csv("data.csv")
> head(data)
     pre home car
1 愛知県   41  32
2 愛媛県   31  34
3 茨城県   15  12
4 岡山県   26  15
5 沖縄県   46  38
6 岩手県   12  23

> cor.test(data$home, data$car, method="spearman")

        Spearman's rank correlation rho

data:  data$home and data$car 
S = 3906, p-value < 2.2e-16
alternative hypothesis: true rho is not equal to 0 
sample estimates:
      rho 
0.7741674

data

メタ情報

inarticle



メタ情報

inarticle



-機械学習

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

SIGNATE お弁当の需要予測-1

SIGNATEのコンペであるお弁当の需要予測をpythonで分析 データは下記から取得できる https://signate.jp/competitions/24 ライブラリ読み込み importnu …

no image

Exploratory Data Analysis

データを取得した後にやることは、データの構造化とクレンジング。それが完了したらData Exploratory Analysisに入る。 Exloratory Data Analysis(EDA)に関 …

no image

UCI datasets

データ分析の勉強をするときに便利なUCI datasets https://archive.ics.uci.edu/ml/datasets.html Related posts:多変量解析回帰と分類の …

no image

仕事で始める機械学習 – 2.機械学習で何ができるか – 分類 – パーセプトロン

パーセプトロン 判別式 それぞれのデータに対して重みづけした値 ヒンジ損失 パーセプトロンの損失関数をヒンジ損失という。パーセプトロン基準とも呼ばれる。 sum(wx) 状態 ラベル label*su …

no image

データサイエンス超入門

シンプソンのパラドックス レコメンドエンジン コンテンツベースフィルタリング 強調 アイテム ユーザー ビジネスにおけるデータ分析の手順 課題→ビジネスケース→仮説→分析→用途 データ分析の手順 デー …

2014年1月
« 12月   2月 »
 12345
6789101112
13141516171819
20212223242526
2728293031  

side bar top



アーカイブ

カテゴリー