科学・IＴ・登山の話題

dataframe形式で便利なのはいろいろなメソッドが用意されているから

投稿日：2018年3月14日

dataframeにすることのメリットは何かといわれると、dataframeにしたとたんに様々な処理をメソッドで実行できるからである。

例えば値がNaNになっていると、処理を進めるうえでいろいろな問題がある。この時にdataframeにしておけば、除外、置換などが簡単にできる。

まずはNaNを持つサンプルdataframeを作成する。


import numpy as np
import pandas as pd
d = {'A':[1,2,np.nan], 'B':[5,np.nan, np.nan], 'C':[1,2,3]}
df = pd.DataFrame(d)
df

この結果としてNaNをもつdataframeが作成される。

A B C
0 1.0 5.0 1
1 2.0 NaN 2
2 NaN NaN 3

まずはNaNをもつ行を除外する。


df.dropna()

A B C
0 1.0 5.0 1

次にNaNを埋めて処理を進めやすくする。


df.fillna(value=0)

A B C
0 1.0 5.0 1
1 2.0 0.0 2
2 0.0 0.0 3

執筆者：admin

: RoboBrowserでUser Agentが原因ではねられているとき

RoboBrowserを利用していると通常のブラウザでリクエストした時とは異なりエラーがページが返ってくることが多い。原因はいくつかあるがまず試したいのはUser-Agentの設定。 RoboBro …

: dataframeで条件を付けて要素を返す方法

前回の続きから。 dfは現在以下のようになっている。 W X Y Z A 2.706850 0.628133 0.907969 0.503826 B 0.651118 -0.319318 -0.848 …

: タイタニックデータでEDA-2

前回は、タイタニックデータについてはビジュアライズしてデータについて理解を深めた。今回はデータをいじって機械学習に使えるようにする。機械学習をするために必要な処理は３つある。 null値の置換余 …

: automated the boring – day4

本日からOS操作。面倒くさいことを自動化するのであればOSコマンドは避けては通れない。 pythonではすでにosパッケージが用意されているので、これを利用すればコードとしてはそれほどはややこしくない …

: seleniumでWebElement object is not iterableが出るときの対処方法

iterableなオブジェクトを想定して要素を取得、forループに取り込むと下記のようなWebElement object is not iterableが出る。結論としては勘違い。 Seleniu …