科学の箱

科学・IT・登山の話題

Python

データ分析で理解しておくべきPythonのデータ構造

投稿日:

Pythonでデータ分析を行う際には基本のデータ構造を理解しておく必要がある。

scikit-learnなどのフレームワークは特定のデータ構造を入力とすることを前提にしている。用意したデータがフレームワークに適合したデータ構造に作り替えるためにはPythonで用意されているデータ構造とその操作を理解することが重要である。pandas、scikit-learnに取り組む前に必ずデータ構造の種類とその特徴を理解しておく。

異なったデータ構造を見るときには次の視点から区別するとよい。

  1. 固定長か可変長か
  2. 変更可能か
  3. 含まれる要素は一種類の型か複数の型か
  4. データ構造を作るときの括弧およびセパレータ

Pythonで機械学習をする際に理解すべきデータ構造は4つある。

  1. タプル
  2. リスト
  3. 辞書
  4. セット

メタ情報

inarticle



メタ情報

inarticle



-Python

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

numpyで配列を抜き出す方法

numpyで配列を抜き出す まず基本となるやり方 arr = np.arange(50).reshape(5,10) arr[1:1,] arr[1:2,]   np.arange(50)で …

no image

NumPyを使ってみる

Pythonでデータ分析の勉強を始めるとまず初めに出てくるパッケージ numpy。これはそもそも何か。 numpyのuser documentを読みながらいじってみる。 https://docs.sc …

no image

配列同士の四則演算

ndarray同士で四則演算ができる。 この四則演算自体はnumpyにおけるbroadcastingと呼ばれる機能およびuniversal functionを利用して実現している。 numpyのbro …

no image

kaggle Titanic Tutorial – 10

いろいろ試しているがうまくいかないので、とりあえずAgeを正しく補完できるか調べる。 調査は線形回帰でどれくらい相関が出るかで判断する。   import numpy as nm impor …

no image

dataframeのgroupbyで使えるメソッド

Dataframeでgroupby経由で使宇メソッド。基礎統計で大事そうなものだけを記載。 mean() sum() std() count() max(), min() describe() Rel …

2019年9月
« 8月   10月 »
 1
2345678
9101112131415
16171819202122
23242526272829
30  

side bar top



アーカイブ

カテゴリー