科学の箱

科学・IT・登山の話題

R 機械学習

条件付きでレコードを取得する

投稿日:

データフレームでは条件付きでレコードを取得できる。

以下のようなフォーマットのデータフレームを考える

  • id
  • name
  • height
vector1 <- c(1, 2, 3, 4, 5)
vector2 <- c("yamada", "tanaka", "watanabe", "takahashi", "shimizu")
vector3 <- c(165, 180, 170, 168, 175)
heightdf = data.frame(id=vector1, name=vector2, height=vector3)

heightdfからレコード番号を指定してレコードを取得する。

> heightdf[2,]
  id   name height
2  2 tanaka    180

> heightdf

  id      name height 2  2    tanaka    180 3  3  watanabe    170 4  4 takahashi    168 > heightdf

  id      name height 1  1    yamada    165 3  3  watanabe    170 4  4 takahashi    168 5  5   shimizu    175 > c(2-4) [1] -2

heightdfから条件付でレコードを取得してみる。

> heightdf[vector1==2,]
  id   name height
2  2 tanaka    180
> vector1==2
[1] FALSE  TRUE FALSE FALSE FALSE

大事なことはboolean値はデータを抽出するデータフレームとはなんら関係ない。booleanのベクタを戻せばよいこと。

> vector4=c(TRUE, TRUE, FALSE, TRUE, FALSE, TRUE)
> heightdf[vector4,]   
id      name height1   
1    yamada    1652   
2    tanaka    1804   
4 takahashi    168
NA NA      <NA>     NA

メタ情報

inarticle



メタ情報

inarticle



-R, 機械学習
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

SVMでグリッドサーチ

IrisデータについてSVMで分類をしてみた。さて、今回はSVMモデルのパラメータをいじってみてより精度が高いモデルを作ってみる。 すべての学習モデルはハイパーパラメータと呼ばれる学習モデルに影響を与 …

no image

Mahout in Action/chap2

2.1 レコメンドには2種類ある。 collaborative filtering contents based filtering collaborative filteringではコンテンツの内容 …

no image

クラスタリング

Rによるクラスタ分析の実行 県別の持家率と自家用車普及率からクラスタ分析を実行し似た県を探してみる。。 データソース 持家と自家用車普及率のデータは下記から取得する 持家普及率のデータはこちらから取得 …

no image

SIGNATE お弁当の需要予測-2

データの内容を確認する。 期間を調べる d_train[‘datetime’].min() ‘ ‘2013-11-18’ d_train[‘datetime’].max() ‘ ‘2014-9-9’ …

no image

Pythonではじめる機械学習 – Chap04

4.4 Binning, Discretization, Linear Models, and Trees ビン化のメリット 決定木でビン化するメリットはあまりない 決定木はモデルの中で一つの特徴につ …

2013年12月
« 11月   1月 »
 1
2345678
9101112131415
16171819202122
23242526272829
3031  

side bar top



アーカイブ

カテゴリー