科学の箱

科学・IT・登山の話題

R

Rでのランダムデータ作成 – 上級編

投稿日:2014年1月31日 更新日:

平均が異なるランダムデータを作成する

> x <- rnorm(12, mean=rep(1:3,each=4), sd=0.2)
> y <- rnorm(12, mean=rep(c(1,2,1), each=4), sd=0.2)

現在ある分布と回帰分析の結果を利用したランダムデータの作成

newGalton <- data.frame(parent=rep(NA,1e6),child=rep(NA,1e6))
      //   NAを使ってデータフレームの箱を作る
newGalton$parent <- rnorm(1e6,mean=mean(galton$parent),sd=sd(galton$parent))
      //   galtonの親データを1e6個作成する
      //   データはオリジナルデータの平均と標準偏差の正規分布から取得される。
newGalton$child <- lm1$coeff[1] + lm1$coeff[2]*newGalton$parent + rnorm(1e6,sd=sd(lm1$residuals))

メタ情報

inarticle



メタ情報

inarticle



-R

執筆者:


  1. foo-bar-baz より:

    newGalton <- data.frame(parent=rep(NA,1e6),child=rep(NA,1e6)) のように「箱を作る」必要はありません。

    newGalton <- rnorm(1e6,mean=mean(galton$parent),sd=sd(galton$parent))
    newGalton$child <- predict(lm1, newGalton)
    で十分です。

  2. […] Rでのランダムデータ作成 – 上級編にコメントをいただいたので調べてみた。結果を対比するためにプロットも入れた。 […]

comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

主成分分析

Rで提供されているirisを使って主成分分析を実施する。 主成分分析の手順 データが分離できるか検証する 主成分負荷量と寄与率を求める 新しい変数に名前を付ける 変量プロット 主成分プロット 今回はR …

no image

Rでのラインの表示

Rでラインを引くために関数がいくつか用意されている。 abline() 画像全体に線を引く segments() 始点と終点を指定してその間に線を引く points() “点” …

no image

diag

3×3の対角行列を生成する > diag(3) [,1] [,2] [,3] [1,] 1 0 0 [2,] 0 1 0 [3,] 0 0 1 3×3の対角行列を生成し、対角 …

no image

サンプルサイズによる有意の違い

こちらでサンプル数について指摘をいただいたのでサンプル数によりp値がどのように変わるかをみてみる。  1996 2012 15~19歳 9 9 20~24歳 12 17 25~29歳 10 18 30 …

no image

Rに関するmemo

グループ毎に度数分布を作成する by(housing$VAL, housing$SERIALNO, length) グループで平均値を計算するための式 DT[,mean(pwgtp15),by=SEX …

2014年1月
« 12月   2月 »
 12345
6789101112
13141516171819
20212223242526
2728293031  

side bar top



アーカイブ

カテゴリー