科学の箱

科学・IT・登山の話題

機械学習

pythonのデータ分析ライブラリで遊んでみる。

投稿日:2014年6月26日 更新日:

こちらを参考にしてPythonのデータ分析用のライブラリをそろえてみた。

まずはお手軽にヒストグラムを書いてみる。コマンドラインからipythonを立ち上げる。

ipython --pylab

–pylabはmatplotlibを利用するための指定する。このパラメータがないとmatplotlibは利用できないので失敗する。

import numpy
import scipy
import pandas
x = randn(10000)
hist(x,100)

これにより正規分布のヒストグラムが表示される。

Pythonを利用した科学技術計算については下記のリンクですばらしいドキュメントが無料で提供されている。

Python Scientific Lecture Notes

メタ情報

inarticle



メタ情報

inarticle



-機械学習
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

dataanalysis-002-week4

クラスタリング SVDと組み合わせることでよりクラスに分かれているクラスタリングを実行できる。 散布図でクラスタリングする変数を探す クラスタリング SVDを実行する SVDの結果をクラスタリングに取 …

no image

dataanalysis-002-week2

Structure of Data Analysis 質問を定義する 理想的なデータセットの定義 アクセスできるデータの検索 データの取得 クレンジング Exploratory 統計的予測・モデリング …

no image

pythonでEDAを実施する – 記述統計

データを取り込む data frameに変換する desdribe()メソッドで要約統計量を出力 各項目について残差分析(ここでは各データが平均値からどの程度離れているか、要するに分散の傾向を把握する …

no image

独立性の検定 2つ

ニートの年齢別割合が1996年と2012年で関連性があるか独立性の検定をしてみる。 ニートの割合  1996 2012 15~19歳 9 9 20~24歳 12 17 25~29歳 10 18 30~ …

no image

Pythonではじめる機械学習 – Chap04

4.4 Binning, Discretization, Linear Models, and Trees ビン化のメリット 決定木でビン化するメリットはあまりない 決定木はモデルの中で一つの特徴につ …

2014年6月
« 5月   7月 »
 1
2345678
9101112131415
16171819202122
23242526272829
30  

side bar top



アーカイブ

カテゴリー