科学の箱

科学・IT・登山の話題

Python

StringIOを使ってread_csvのテストをしてみる

投稿日:

pandasで操作できるファイルは様々なあるが、csvはJSONと並んで取り扱うことが多いファイルである。ちょっとしたコードの検証をしたいときに毎回csvを用意して、read_csv()で読み込むのはかったるい。このような時StringIOを使うとすべてコード上で完結する。

 

このページの内容

  • StringIOの基本情報
  • StringIOとread_csv
  • パラメータを変えて読み込む

StringIO

StringIOはpythonで用意されている標準オブジェクトである。

class io.StringIO

引数

  • 第一引数: 文字列

戻り値

  • StringIO: このオブジェクトはread_csv()に対して入力として利用できる。

StringIOとread_csv

StringIOに文字列を与えると、ファイル入出力として使える。

from io import StringIO
import pandas as pd
data = ('name,company,city,tel\n'
       'Suzuki,CompanyA,Tokyo,090-123-456\n'
       'Yamada,CompanyB,Chiba,03-123-456\n'
       'Takahashi,CompanyC,Kanagawa,070-123-456')
df=pd.read_csv(StringIO(data))
print(df)
#        name   company      city          tel
0     Suzuki  CompanyA     Tokyo  090-123-456
1     Yamada  CompanyB     Chiba   03-123-456
2  Takahashi  CompanyC  Kanagawa  070-123-456

 

パラメータを変えて読み込む

いくつかパラメータを変えて読み込んでみる

まずはindex_colを指定して、indexを設定する。

df=pd.read_csv(StringIO(data), index_col="name")
print(df)

#             company      city          tel
name                                      
Suzuki     CompanyA     Tokyo  090-123-456
Yamada     CompanyB     Chiba   03-123-456
Takahashi  CompanyC  Kanagawa  070-123-456

 

usecolsを指定して、読み込む列を選ぶ。

df=pd.read_csv(StringIO(data), usecols=["name","city"])
print(df)

#         name      city
0     Suzuki     Tokyo
1     Yamada     Chiba
2  Takahashi  Kanagawa

 

メタ情報

inarticle



メタ情報

inarticle



-Python
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

生成した配列をグラフで確認

生成した配列を可視化するためにはmatplotlibが利用できる。 ここでは簡単に可視化するための使い方を見てみる。 まずはnumpyとmatplolibモジュールを読み込む。以下ではnumpyはnp …

no image

pandaの基本中の基本操作

numpyとpandaのインポート import numpy as np import pandas as pd 前準備 labels = [‘a’, ‘b’, ‘c’] mydata = [10,2 …

no image

配列のインデックス

インデックスとは配列に対して[]で要素を抜き出す方法である。 マニュアルは以下になる。 Indexing Indexing Routines インデックスの方法としては以下がある。 整数値を使ったイン …

no image

RoboBrowserで提供しているメソッドget_linksにおけるパラメータの指定方法

get_linksは便利だが文字列を指定する際に少々手間取った。 結論から言うと文字列で指定する方法とre.compileオブジェクトを指定する方法の2つがある。 まず一つ目は単純な文字列。exact …

no image

automated the boring – day4

本日からOS操作。面倒くさいことを自動化するのであればOSコマンドは避けては通れない。 pythonではすでにosパッケージが用意されているので、これを利用すればコードとしてはそれほどはややこしくない …

2019年9月
« 8月   10月 »
 1
2345678
9101112131415
16171819202122
23242526272829
30  

side bar top



アーカイブ

カテゴリー