科学・IＴ・登山の話題

seabornをEDAに応用する

投稿日：2018年3月27日更新日：2018年4月13日

seabornを利用すれば基本となるビジュアルと分布、regressionをすぐに取得できる。


import seaborn as sns

tips = sns.load_dataset('tips')

tips.info()

tips.head()

tips.describe()

sns.pairplot(tips, hue='sex', palette='coolwarm')

以上で基本の調査ができる。

データについてトレンドを見る場合にはvalue_counts()を利用する


df['zip'].value_counts().head(5)

カテゴリーのユニークを見る

df['zip'].unique()

ある一つの項目について分布をみるならば


sns.distplot(tips['total_bill'], kde=False)

2つ以上の変数に関連性を見るためにはjointplotを利用する。


sns.jointplot(x='total_bill', y='tip', data=tips, kind='kde')

カテゴリカル変数で違いがあるかを見るためにはまずcountplotでデータの件数を把握してbarplotで各変数に違いがあるかを確認する。


sns.countplot(x='sex', data=tips)

sns.barplot(x='sex', y='total_bill', data=tips)

Related posts:

automated the boring – day7

Python + Slack Bot – 3

配列の属性を確認

-Python
-Python

執筆者：admin

comment コメントをキャンセル

関連記事

: 初めてのmatplotlib

matplotlibを使えばpythonで様々なグラフをデータから作成できる。初めてのmatplotlibということで、単純なグラフを作成する。まずはmatplotlibを読み込む >> …

: tensorflowをpipでインストールするときのオプション

tensorflow環境を構築するときにはpipを利用すると簡単である。pipの簡単な使い方としてはinstallオプションを指定すればよい。 pip install tensoflow しかしこのオ …

: RoboBrowserでUser Agentが原因ではねられているとき

RoboBrowserを利用していると通常のブラウザでリクエストした時とは異なりエラーがページが返ってくることが多い。原因はいくつかあるがまず試したいのはUser-Agentの設定。 RoboBro …

: pythonで地理情報を取り扱う

pythonでデータ分析をして地理情報に表示したいときに使うパッケージはplotlyである。 plotlyのchropleth map（階級区分図）を利用する。 plotlyについてはこちらでサンプル …

: wordpress-xmlrpc

WordPressへPythonから投稿してみる。まずは設定から。説明はこちらにある。 https://python-wordpress-xmlrpc.readthedocs.io/en/lates …

PREV: matplotlibのお役立ちリンク
NEXT: seabornで線形解析を実施する

GIMPでForeground color pickerが正しくない色をピックアップするときの対応方法 2021年9月7日
lerpとslerpの違い 2021年8月5日
シェーダーとは 2021年8月3日
Unityの座標系についてメモ 2021年7月1日
ALLとREMOVEFILTERSの違い 2021年6月28日