科学の箱

科学・IT・登山の話題

R 機械学習

条件付きでレコードを取得する

投稿日:

データフレームでは条件付きでレコードを取得できる。

以下のようなフォーマットのデータフレームを考える

  • id
  • name
  • height
vector1 <- c(1, 2, 3, 4, 5)
vector2 <- c("yamada", "tanaka", "watanabe", "takahashi", "shimizu")
vector3 <- c(165, 180, 170, 168, 175)
heightdf = data.frame(id=vector1, name=vector2, height=vector3)

heightdfからレコード番号を指定してレコードを取得する。

> heightdf[2,]
  id   name height
2  2 tanaka    180

> heightdf

  id      name height 2  2    tanaka    180 3  3  watanabe    170 4  4 takahashi    168 > heightdf

  id      name height 1  1    yamada    165 3  3  watanabe    170 4  4 takahashi    168 5  5   shimizu    175 > c(2-4) [1] -2

heightdfから条件付でレコードを取得してみる。

> heightdf[vector1==2,]
  id   name height
2  2 tanaka    180
> vector1==2
[1] FALSE  TRUE FALSE FALSE FALSE

大事なことはboolean値はデータを抽出するデータフレームとはなんら関係ない。booleanのベクタを戻せばよいこと。

> vector4=c(TRUE, TRUE, FALSE, TRUE, FALSE, TRUE)
> heightdf[vector4,]   
id      name height1   
1    yamada    1652   
2    tanaka    1804   
4 takahashi    168
NA NA      <NA>     NA

メタ情報

inarticle



メタ情報

inarticle



-R, 機械学習
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

Pythonではじめる機械学習 – KDE

カーネル密度分布とは カーネル密度分布とは一言でいうと滑らかなヒストグラムであり曲線になっている。標本データから確率密度を計算することにより標本がない部分についても確率密度を計算できる。 例えば犯罪の …

no image

dataanalysis-002-week1

Rstudioを開発に使う 開発が用意 Forumがある 標準 フリー Help R Mailling list Stackoverflow CrossValidated R-Help ?rnorm …

no image

多変量解析

多変量解析の分類 回帰分析 ロジスティック分析 判別分析 主成分分析 因子分析 共分散 クラスタリング 共分散 Sxy = Σ(Xi – X~)(Yi – Y~) / n 共分 …

no image

Rで型が不明なときの対処方法

データセットならstrを使う > str(iris) ‘data.frame’:   150 obs. of  5 variables:  $ Sepal.Length: num  5.1 4. …

no image

Rによるやさしい統計学/7-分散分析

(1)学部によりテストの結果に有意な差があるかを調べる。 データはcsv形式で作成し、7_1_test_score.csvとする。以下はデータの内容。 法学部,文学部,理学部,工学部 75,62,65 …

2013年12月
« 11月   1月 »
 1
2345678
9101112131415
16171819202122
23242526272829
3031  

side bar top



アーカイブ

カテゴリー