科学の箱

科学・IT・登山の話題

Python

kaggle Titanic Tutorial – 5

投稿日:2018年5月26日 更新日:

ファミリーサイズを追加してみる。

ソースはこちらを参照した。

https://www.kaggle.com/lperez/titanic-a-deeper-look-on-family-size

主要な変更部分だけ記載

まずはfamilysizeを作成する


d_train = pd.read_csv('train.csv')
d_test = pd.read_csv('test.csv')

d_train['title'] = d_train['Name'].apply(get_title).map(Title_Dictionary)
d_test['title'] = d_test['Name'].apply(get_title).map(Title_Dictionary)
d_train['FamilySize'] = d_train['SibSp'] + d_train['Parch'] + 1
d_test['FamilySize'] = d_test['SibSp'] + d_test['Parch'] + 1

ParchとSibSpはどろっぷ


d_train = d_train.drop(['PassengerId','Name','Ticket','Cabin', 'Parch','SibSp'], axis=1)

分析にFamilySizeを追加、ParchとSibSpを削除する。


x_train = d_train[["Pclass", "Sex", "Age", "Fare", "Embarked", "FamilySize", "title"]].values
x_test = d_test[["Pclass", "Sex", "Age", "Fare", "Embarked", "FamilySize", "title"]].values

from sklearn.tree import DecisionTreeClassifier
dtree = DecisionTreeClassifier(max_depth=8)
dtree.fit(x_train,y_train)

predictions = dtree.predict(x_test)

ようやく6000番台に突入。

メタ情報

inarticle



メタ情報

inarticle



-Python
-,

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

pandaでdataframeを利用するときの基本操作

Dataframeを作成します。 import numpy as np import pandas as pd from numpy.random import randn np.random.see …

no image

tensorflowをpipでインストールするときのオプション

tensorflow環境を構築するときにはpipを利用すると簡単である。pipの簡単な使い方としてはinstallオプションを指定すればよい。 pip install tensoflow しかしこのオ …

no image

matplotlibでfigureを利用する

matplotlibでfigureオブジェクトを利用するとグラフを表示する位置を細かく指定できる。 まずはfigureを使ってグラフを一つ表示してみる。 >>> import mat …

no image

cp932 error

pythonで入力ファイルにおける文字コードが正しく認識されない場合、以下のようなエラーがでる。 UnicodeDecodeError: ‘cp932’ codec can&# …

no image

UnionFindのfindについて処理を考える。

UnionFindにおけるfind()もしくはroot()はルート(グループの根)を見つける処理である。 記述方法としては2種類ある。 whileループを回す 再帰処理 それぞれについて動きを確認して …

2018年5月
« 4月   6月 »
 123456
78910111213
14151617181920
21222324252627
28293031  

side bar top



アーカイブ

カテゴリー