科学・IＴ・登山の話題

連続データのビジュアル

投稿日：2018年6月5日更新日：2018年6月12日

Kaggle TitanicのFareを使っていくつかビジュアル

金額別ヒストグラム-1

titanic_df['Fare'].plot(kind='hist', figsize=(15,3),bins=100, xlim=(0,50))

xlimが簡単に設定できる

金額別ヒストグラム-2

sns.distplot(d_train[“Fare”], kde=False, rug=False, bins=100)

xlimは軸で設定するのでひと手間かかる

生存別金額-1

avgerage_fare = pd.DataFrame([fare_not_survived.mean(), fare_survived.mean()])
std_fare = pd.DataFrame([fare_not_survived.std(), fare_survived.std()])
avgerage_fare.plot(yerr=std_fare,kind=’bar’,legend=False)

みやすい。

生存別金額-2

sns.boxplot(x=’Survived’, y=”Fare”, data=d_train, palette=”PRGn”)

外れ値に左右される→外れ値を削除する。

生存別金額-3

sns.violinplot(x=’Survived’, y=”Fare”, data=d_train)

概要をつかむにはboxplotよりよい。

Related posts:

pyperclipを設定する

生成した配列をグラフで確認

pipインストールでエラーが出る場合

-Python
-Python

執筆者：admin

comment コメントをキャンセル

関連記事

: OpenCV

WindowsにOpenCVをインストールする場合に2つのやり方がある。一つは様々な言語からOpenCVを利用できるようにする方法、2つ目の方法ではPythonからOpenCVを利用する方法である。 …

: automated the boring – day9

https://automatetheboringstuff.com/chapter17/ >>> from PIL import Image &gt …

: graphvizのコマンドラインから実行

dot -Kdot -Tpng test.dot -o test.png Related posts:pandaの基本中の基本操作janomeで品詞を解析する配列のインデックス

: kaggle Titanic Tutorial – 8

前回の結果がいまいちだった。これまではAgeは平均値でNullを埋めていた。平均値では明らか実際のデータと差異が出ると考えられる。そのためAgeがない情報についてより正確なAgeで補完するようにした。 …

: RoboBrowserで提供しているメソッドget_linksにおけるパラメータの指定方法

get_linksは便利だが文字列を指定する際に少々手間取った。結論から言うと文字列で指定する方法とre.compileオブジェクトを指定する方法の2つがある。まず一つ目は単純な文字列。exact …

PREV: kaggle Titanic Tutorial – 9
NEXT: カテゴリデータのビジュアル

GIMPでForeground color pickerが正しくない色をピックアップするときの対応方法 2021年9月7日
lerpとslerpの違い 2021年8月5日
シェーダーとは 2021年8月3日
Unityの座標系についてメモ 2021年7月1日
ALLとREMOVEFILTERSの違い 2021年6月28日