科学の箱

科学・IT・登山の話題

Python

SIGNATE お弁当の需要予測-3

投稿日:2018年5月15日 更新日:

Seabornを利用してデータをビジュアル化してみる。

まずは売り上げの分布図から


sns.distplot(d_train['y'], kde=False, rug=False, bins=50)

次に気温の分布を確認する


sns.distplot(d_train['temperature'], kde=False, rug=False, bins=30)

 

売上の時系列トレンドを確認


fig=sns.pointplot(x="datetime", y="y", data=d_train, markers=[""])
fig.set_xlabel("Date")
fig.set_ylabel("Sales")

曜日別に売上分布を確認する。


fig=sns.boxplot(x="week", y="y", data=d_train)


曜日別の売上を天気別にみて統計的に変化があるかを確認する


fig=sns.barplot(x="week", y="y", hue="weather", data=d_train)

fig=sns.pointplot(x="week", y="y", hue="weather", data=d_train)

 

 

メタ情報

inarticle



メタ情報

inarticle



-Python
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

pythonでsha3をつかう

pip install sha3だと何かがダウンロードされるが下記のエラーが表示される。 c:\users\usera\appdata\local\temp\pip-install-1v_qtdxo\ …

no image

kaggle Titanic Tutorial – 6

さて、今回は年齢について検証する。まずこれまでは中央値を使っていたわけだ。これをもともと年齢分布と中央値を使って更新した後の年齢分布を比較する。 import numpy as nm import p …

no image

automated the boring – day4

本日からOS操作。面倒くさいことを自動化するのであればOSコマンドは避けては通れない。 pythonではすでにosパッケージが用意されているので、これを利用すればコードとしてはそれほどはややこしくない …

no image

連続データのビジュアル

Kaggle TitanicのFareを使っていくつかビジュアル 金額別ヒストグラム-1 titanic_df[‘Fare’].plot(kind=’hist’, figsize=(15,3),bin …

no image

pandaのチュートリアル

pandaを利用すればdata frameに関連する操作はすべて実行できる。この辺のチュートリアルというか、何かまとめたドキュメントは何か調べてみた。 https://www.dataquest.io …

2018年5月
« 4月   6月 »
 123456
78910111213
14151617181920
21222324252627
28293031  

side bar top



アーカイブ

カテゴリー