科学の箱

科学・IT・登山の話題

R 機械学習

条件付きでレコードを取得する

投稿日:

データフレームでは条件付きでレコードを取得できる。

以下のようなフォーマットのデータフレームを考える

  • id
  • name
  • height
vector1 <- c(1, 2, 3, 4, 5)
vector2 <- c("yamada", "tanaka", "watanabe", "takahashi", "shimizu")
vector3 <- c(165, 180, 170, 168, 175)
heightdf = data.frame(id=vector1, name=vector2, height=vector3)

heightdfからレコード番号を指定してレコードを取得する。

> heightdf[2,]
  id   name height
2  2 tanaka    180

> heightdf

  id      name height 2  2    tanaka    180 3  3  watanabe    170 4  4 takahashi    168 > heightdf

  id      name height 1  1    yamada    165 3  3  watanabe    170 4  4 takahashi    168 5  5   shimizu    175 > c(2-4) [1] -2

heightdfから条件付でレコードを取得してみる。

> heightdf[vector1==2,]
  id   name height
2  2 tanaka    180
> vector1==2
[1] FALSE  TRUE FALSE FALSE FALSE

大事なことはboolean値はデータを抽出するデータフレームとはなんら関係ない。booleanのベクタを戻せばよいこと。

> vector4=c(TRUE, TRUE, FALSE, TRUE, FALSE, TRUE)
> heightdf[vector4,]   
id      name height1   
1    yamada    1652   
2    tanaka    1804   
4 takahashi    168
NA NA      <NA>     NA

メタ情報

inarticle



メタ情報

inarticle



-R, 機械学習
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

Pythonではじめる機械学習 – Chap04

4.4 Binning, Discretization, Linear Models, and Trees ビン化のメリット 決定木でビン化するメリットはあまりない 決定木はモデルの中で一つの特徴につ …

no image

cexについてまとめる

Rでグラフィックのパラメータはpar()で指定する。par()のパラメータを変更することでplotなどの表示方法を柔軟に変更できる。例えばラベルのフォントの大きさなどである。下記はpar()で指定でき …

no image

主成分分析

Rで提供されているirisを使って主成分分析を実施する。 主成分分析の手順 データが分離できるか検証する 主成分負荷量と寄与率を求める 新しい変数に名前を付ける 変量プロット 主成分プロット 今回はR …

no image

データ取り込み後に確認すること

# tidyデータの原則 # 1カラム = 1変数 # 1行 = 1観察 # 1テーブル = 1 unique key # foreign key to link # テーブル全体で見ること # カラ …

no image

Rでのラインの表示

Rでラインを引くために関数がいくつか用意されている。 abline() 画像全体に線を引く segments() 始点と終点を指定してその間に線を引く points() “点” …

2013年12月
« 11月   1月 »
 1
2345678
9101112131415
16171819202122
23242526272829
3031  

side bar top



アーカイブ

カテゴリー