科学の箱

科学・IT・登山の話題

Python

dataframe形式で便利なのはいろいろなメソッドが用意されているから

投稿日:

dataframeにすることのメリットは何かといわれると、dataframeにしたとたんに様々な処理をメソッドで実行できるからである。

例えば値がNaNになっていると、処理を進めるうえでいろいろな問題がある。この時にdataframeにしておけば、除外、置換などが簡単にできる。

まずはNaNを持つサンプルdataframeを作成する。


import numpy as np
import pandas as pd
d = {'A':[1,2,np.nan], 'B':[5,np.nan, np.nan], 'C':[1,2,3]}
df = pd.DataFrame(d)
df

この結果としてNaNをもつdataframeが作成される。

A B C
0 1.0 5.0 1
1 2.0 NaN 2
2 NaN NaN 3

まずはNaNをもつ行を除外する。


df.dropna()

A B C
0 1.0 5.0 1

次にNaNを埋めて処理を進めやすくする。


df.fillna(value=0)

A B C
0 1.0 5.0 1
1 2.0 0.0 2
2 0.0 0.0 3

 

メタ情報

inarticle



メタ情報

inarticle



-Python
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

RoboBrowserでUser Agentが原因ではねられているとき

RoboBrowserを利用していると通常のブラウザでリクエストした時とは異なりエラーがページが返ってくることが多い。 原因はいくつかあるがまず試したいのはUser-Agentの設定。 RoboBro …

no image

dataframeで条件を付けて要素を返す方法

前回の続きから。 dfは現在以下のようになっている。 W X Y Z A 2.706850 0.628133 0.907969 0.503826 B 0.651118 -0.319318 -0.848 …

no image

タイタニックデータでEDA-2

前回は、タイタニックデータについてはビジュアライズしてデータについて理解を深めた。 今回はデータをいじって機械学習に使えるようにする。 機械学習をするために必要な処理は3つある。 null値の置換 余 …

no image

automated the boring – day4

本日からOS操作。面倒くさいことを自動化するのであればOSコマンドは避けては通れない。 pythonではすでにosパッケージが用意されているので、これを利用すればコードとしてはそれほどはややこしくない …

no image

seleniumでWebElement object is not iterableが出るときの対処方法

iterableなオブジェクトを想定して要素を取得、forループに取り込むと下記のようなWebElement object is not iterableが出る。 結論としては勘違い。 Seleniu …

2018年3月
« 2月   4月 »
 1234
567891011
12131415161718
19202122232425
262728293031  

side bar top



アーカイブ

カテゴリー