平均が異なるランダムデータを作成する
> x <- rnorm(12, mean=rep(1:3,each=4), sd=0.2) > y <- rnorm(12, mean=rep(c(1,2,1), each=4), sd=0.2)
現在ある分布と回帰分析の結果を利用したランダムデータの作成
newGalton <- data.frame(parent=rep(NA,1e6),child=rep(NA,1e6))
// NAを使ってデータフレームの箱を作る
newGalton$parent <- rnorm(1e6,mean=mean(galton$parent),sd=sd(galton$parent))
// galtonの親データを1e6個作成する
// データはオリジナルデータの平均と標準偏差の正規分布から取得される。
newGalton$child <- lm1$coeff[1] + lm1$coeff[2]*newGalton$parent + rnorm(1e6,sd=sd(lm1$residuals))
newGalton <- data.frame(parent=rep(NA,1e6),child=rep(NA,1e6)) のように「箱を作る」必要はありません。
newGalton <- rnorm(1e6,mean=mean(galton$parent),sd=sd(galton$parent))
newGalton$child <- predict(lm1, newGalton)
で十分です。
[…] Rでのランダムデータ作成 – 上級編にコメントをいただいたので調べてみた。結果を対比するためにプロットも入れた。 […]