科学の箱

科学・IT・登山の話題

機械学習

pythonのデータ分析ライブラリで遊んでみる。

投稿日:2014年6月26日 更新日:

こちらを参考にしてPythonのデータ分析用のライブラリをそろえてみた。

まずはお手軽にヒストグラムを書いてみる。コマンドラインからipythonを立ち上げる。

ipython --pylab

–pylabはmatplotlibを利用するための指定する。このパラメータがないとmatplotlibは利用できないので失敗する。

import numpy
import scipy
import pandas
x = randn(10000)
hist(x,100)

これにより正規分布のヒストグラムが表示される。

Pythonを利用した科学技術計算については下記のリンクですばらしいドキュメントが無料で提供されている。

Python Scientific Lecture Notes

メタ情報

inarticle



メタ情報

inarticle



-機械学習
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

R Dataset – AirPassengers

データの説明 1949~1960年における月別飛行機搭乗者数 フォーマット このデータは時系列データであることがわかる。 > str(AirPassengers)  Time-Series [1 …

no image

Core Concept in Data Analysis – Week 5

予測の分析 関連性を分析する モデルを明らかにする。 パラメータを推測する。 テストする。 予測が将来になると難しい→環境が変わってしまうため。 correlation structure (質的尺度 …

no image

スピアマンの順位相関

スピアマンの順位相関を利用して県のデータを使った相関係数を出してみる。 持家普及率を自動車普及率のランキングは、土地がせまいほど低く、有効な土地が広いほど高くなるために順位相関があると考えられる。 持 …

no image

線形回帰とリッジ回帰とラッソ回帰の違い

用語 線形回帰 データから平均二乗誤差を最低にするパラメータΘを求めて、直線で回帰すること $$ y = Θ_0 + Θ_1 \times x $$ コスト関数 損失関数とも呼ばれる。実際のデータと予 …

no image

tracertの分析

tracertを繰り返し実行した結果を分析し、経路上のホストについてどの程度時間がかかっているかを分析してみる。 tracertの結果は以下のように取得される。 $ tracert www.googl …

2014年6月
« 5月   7月 »
 1
2345678
9101112131415
16171819202122
23242526272829
30  

side bar top



アーカイブ

カテゴリー