科学の箱

科学・IT・登山の話題

Python

データ分析で理解しておくべきPythonのデータ構造

投稿日:

Pythonでデータ分析を行う際には基本のデータ構造を理解しておく必要がある。

scikit-learnなどのフレームワークは特定のデータ構造を入力とすることを前提にしている。用意したデータがフレームワークに適合したデータ構造に作り替えるためにはPythonで用意されているデータ構造とその操作を理解することが重要である。pandas、scikit-learnに取り組む前に必ずデータ構造の種類とその特徴を理解しておく。

異なったデータ構造を見るときには次の視点から区別するとよい。

  1. 固定長か可変長か
  2. 変更可能か
  3. 含まれる要素は一種類の型か複数の型か
  4. データ構造を作るときの括弧およびセパレータ

Pythonで機械学習をする際に理解すべきデータ構造は4つある。

  1. タプル
  2. リスト
  3. 辞書
  4. セット

メタ情報

inarticle



メタ情報

inarticle



-Python

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

dataframeのgroupbyで使えるメソッド

Dataframeでgroupby経由で使宇メソッド。基礎統計で大事そうなものだけを記載。 mean() sum() std() count() max(), min() describe() Rel …

no image

numpy.linspace()を使って等差数列を生成する

一次関数と等差数列 一次関数をテストするときに必須になるのが等差数列。等差数列とは要素と要素の間の差が等しいもの。 例えば1, 2, 3, 4, 5, 6は等差が1の数列である。等差が2になると、1, …

no image

kaggle Titanic Tutorial – 8

前回の結果がいまいちだった。これまではAgeは平均値でNullを埋めていた。平均値では明らか実際のデータと差異が出ると考えられる。そのためAgeがない情報についてより正確なAgeで補完するようにした。 …

no image

tensorflowをpipでインストールするときのオプション

tensorflow環境を構築するときにはpipを利用すると簡単である。pipの簡単な使い方としてはinstallオプションを指定すればよい。 pip install tensoflow しかしこのオ …

no image

Anaconda Jupyterで自動補完を使う手順

まずはnbexensionsをインストール。これは拡張モジュールを管理する機能。 conda install -y -c conda-forge jupyter_contrib_nbextension …

2019年9月
« 8月   10月 »
 1
2345678
9101112131415
16171819202122
23242526272829
30  

side bar top



アーカイブ

カテゴリー