科学の箱

科学・IT・登山の話題

Python

データ分析で理解しておくべきPythonのデータ構造

投稿日:

Pythonでデータ分析を行う際には基本のデータ構造を理解しておく必要がある。

scikit-learnなどのフレームワークは特定のデータ構造を入力とすることを前提にしている。用意したデータがフレームワークに適合したデータ構造に作り替えるためにはPythonで用意されているデータ構造とその操作を理解することが重要である。pandas、scikit-learnに取り組む前に必ずデータ構造の種類とその特徴を理解しておく。

異なったデータ構造を見るときには次の視点から区別するとよい。

  1. 固定長か可変長か
  2. 変更可能か
  3. 含まれる要素は一種類の型か複数の型か
  4. データ構造を作るときの括弧およびセパレータ

Pythonで機械学習をする際に理解すべきデータ構造は4つある。

  1. タプル
  2. リスト
  3. 辞書
  4. セット

メタ情報

inarticle



メタ情報

inarticle



-Python

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

matplotlibのお役立ちリンク

matplotlibのリファレンスが必要ならこちらを参照する。 https://www.labri.fr/perso/nrougier/teaching/matplotlib/ Related pos …

no image

RoboBrowserでUser Agentが原因ではねられているとき

RoboBrowserを利用していると通常のブラウザでリクエストした時とは異なりエラーがページが返ってくることが多い。 原因はいくつかあるがまず試したいのはUser-Agentの設定。 RoboBro …

no image

kaggle Titanic Tutorial – 6

さて、今回は年齢について検証する。まずこれまでは中央値を使っていたわけだ。これをもともと年齢分布と中央値を使って更新した後の年齢分布を比較する。 import numpy as nm import p …

no image

dataframe形式で便利なのはいろいろなメソッドが用意されているから

dataframeにすることのメリットは何かといわれると、dataframeにしたとたんに様々な処理をメソッドで実行できるからである。 例えば値がNaNになっていると、処理を進めるうえでいろいろな問題 …

no image

pythonで地理情報を取り扱う

pythonでデータ分析をして地理情報に表示したいときに使うパッケージはplotlyである。 plotlyのchropleth map(階級区分図)を利用する。 plotlyについてはこちらでサンプル …

2019年9月
« 8月   10月 »
 1
2345678
9101112131415
16171819202122
23242526272829
30  

side bar top



アーカイブ

カテゴリー