科学の箱

科学・IT・登山の話題

機械学習

pythonのデータ分析ライブラリで遊んでみる。

投稿日:2014年6月26日 更新日:

こちらを参考にしてPythonのデータ分析用のライブラリをそろえてみた。

まずはお手軽にヒストグラムを書いてみる。コマンドラインからipythonを立ち上げる。

ipython --pylab

–pylabはmatplotlibを利用するための指定する。このパラメータがないとmatplotlibは利用できないので失敗する。

import numpy
import scipy
import pandas
x = randn(10000)
hist(x,100)

これにより正規分布のヒストグラムが表示される。

Pythonを利用した科学技術計算については下記のリンクですばらしいドキュメントが無料で提供されている。

Python Scientific Lecture Notes

メタ情報

inarticle



メタ情報

inarticle



-機械学習
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

pythonでEDAを実施する – 記述統計

データを取り込む data frameに変換する desdribe()メソッドで要約統計量を出力 各項目について残差分析(ここでは各データが平均値からどの程度離れているか、要するに分散の傾向を把握する …

no image

dataanalysis-002-week1

Rstudioを開発に使う 開発が用意 Forumがある 標準 フリー Help R Mailling list Stackoverflow CrossValidated R-Help ?rnorm …

no image

dataanalysis-002-week5

ANOVA – quantitative 分散分析、数学的に分散分析と重回帰分析は同じ 分散分析では3群以上の平均の差異を検定する ただし非線形では異なる http://oshiete.g …

no image

条件付きでレコードを取得する

データフレームでは条件付きでレコードを取得できる。 以下のようなフォーマットのデータフレームを考える id name height vector1 <- c(1, 2, 3, 4, 5) vec …

no image

会社を変える分析の力

ユーザに関する問題 不確実性 過剰期待 事前期待 分析モデルの利用 パターン 変数の数 分析の利用 予測 判別 グループ 検知 最適化 発見 探索 データ分析の必要性 なぜ誤差がでるのか Costは …

2014年6月
« 5月   7月 »
 1
2345678
9101112131415
16171819202122
23242526272829
30  

side bar top



アーカイブ

カテゴリー