科学の箱

科学・IT・登山の話題

Python

データ分析で理解しておくべきPythonのデータ構造

投稿日:

Pythonでデータ分析を行う際には基本のデータ構造を理解しておく必要がある。

scikit-learnなどのフレームワークは特定のデータ構造を入力とすることを前提にしている。用意したデータがフレームワークに適合したデータ構造に作り替えるためにはPythonで用意されているデータ構造とその操作を理解することが重要である。pandas、scikit-learnに取り組む前に必ずデータ構造の種類とその特徴を理解しておく。

異なったデータ構造を見るときには次の視点から区別するとよい。

  1. 固定長か可変長か
  2. 変更可能か
  3. 含まれる要素は一種類の型か複数の型か
  4. データ構造を作るときの括弧およびセパレータ

Pythonで機械学習をする際に理解すべきデータ構造は4つある。

  1. タプル
  2. リスト
  3. 辞書
  4. セット

メタ情報

inarticle



メタ情報

inarticle



-Python

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

wordpress-xmlrpc

WordPressへPythonから投稿してみる。 まずは設定から。説明はこちらにある。 https://python-wordpress-xmlrpc.readthedocs.io/en/lates …

no image

kaggle Titanic Tutorial – 7

さて今回はAgeを補完してから、元の分布と比べてみる。 def fill_age(row): condition = ( (d_train_g_m[‘Sex’] == row[‘Sex’]) &amp …

no image

automated the boring – day9

https://automatetheboringstuff.com/chapter17/ >>> from PIL import Image &gt …

no image

PythonでMicrosoft Visual C++ 14.0 is required エラーが出た場合

Visual Studio 2017だけでは不十分である。   https://visualstudio.microsoft.com/ja/downloads/から下記のリンク経由でBuil …

no image

配列を利用した四則演算とuniversal関数

四則演算 import numpy as np arr = np.arange(1,11) arr arr + arr arr * arr arr – 100 arr – arr [/cde] np. …

2019年9月
« 8月   10月 »
 1
2345678
9101112131415
16171819202122
23242526272829
30  

side bar top



アーカイブ

カテゴリー