科学の箱

科学・IT・登山の話題

Python

連続データのビジュアル

投稿日:2018年6月5日 更新日:

Kaggle TitanicのFareを使っていくつかビジュアル

金額別ヒストグラム-1
  • titanic_df['Fare'].plot(kind='hist', figsize=(15,3),bins=100, xlim=(0,50))

xlimが簡単に設定できる

 

金額別ヒストグラム-2
  • sns.distplot(d_train[“Fare”], kde=False, rug=False, bins=100)
 
xlimは軸で設定するのでひと手間かかる
生存別金額-1
  • avgerage_fare = pd.DataFrame([fare_not_survived.mean(), fare_survived.mean()])
  • std_fare = pd.DataFrame([fare_not_survived.std(), fare_survived.std()])
  • avgerage_fare.plot(yerr=std_fare,kind=’bar’,legend=False)

みやすい。

 

生存別金額-2
  • sns.boxplot(x=’Survived’, y=”Fare”, data=d_train, palette=”PRGn”)

外れ値に左右される→外れ値を削除する。

 

生存別金額-3

  • sns.violinplot(x=’Survived’, y=”Fare”, data=d_train)

概要をつかむにはboxplotよりよい。

メタ情報

inarticle



メタ情報

inarticle



-Python
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

automated the boring – day6

https://automatetheboringstuff.com/chapter11/ さてこの辺からようやく面白くなってくる。webscrapingをするにあたり、まずはブラウザをpythonか …

no image

PythonでMicrosoft Visual C++ 14.0 is required エラーが出た場合

Visual Studio 2017だけでは不十分である。   https://visualstudio.microsoft.com/ja/downloads/から下記のリンク経由でBuil …

no image

model.coef_の確認

重回帰分析で重みを確認するには下記を利用する。 model.coef_ ただしこれだと有効桁数が分かりにくいので有効桁数を3桁にして、さらに指数を展開する。 np.set_printoptions(p …

no image

Python + Slack Bot – 2

Slackのチャネルに投稿するにはChanel IDが必要。 Chanel IDは下記から取得できる。 https://api.slack.com/methods/channels.list/test …

no image

複数のグラフを表示する方法

ここでは以下を説明する。 複数のグラフを表示する2つの方法 サブプロットのグラフを整形 複数のグラフを表示する 複数のグラフを表示するためには二通りの方法がある。 subplots()を使ってあらかじ …

2018年6月
« 5月   9月 »
 123
45678910
11121314151617
18192021222324
252627282930  

side bar top



アーカイブ

カテゴリー