科学・IＴ・登山の話題

kaggle Titanic Tutorial – 5

投稿日：2018年5月26日更新日：2018年5月30日

ファミリーサイズを追加してみる。

ソースはこちらを参照した。

https://www.kaggle.com/lperez/titanic-a-deeper-look-on-family-size

主要な変更部分だけ記載

まずはfamilysizeを作成する


d_train = pd.read_csv('train.csv')
d_test = pd.read_csv('test.csv')

d_train['title'] = d_train['Name'].apply(get_title).map(Title_Dictionary)
d_test['title'] = d_test['Name'].apply(get_title).map(Title_Dictionary)
d_train['FamilySize'] = d_train['SibSp'] + d_train['Parch'] + 1
d_test['FamilySize'] = d_test['SibSp'] + d_test['Parch'] + 1

ParchとSibSpはどろっぷ


d_train = d_train.drop(['PassengerId','Name','Ticket','Cabin', 'Parch','SibSp'], axis=1)

分析にFamilySizeを追加、ParchとSibSpを削除する。


x_train = d_train[["Pclass", "Sex", "Age", "Fare", "Embarked", "FamilySize", "title"]].values
x_test = d_test[["Pclass", "Sex", "Age", "Fare", "Embarked", "FamilySize", "title"]].values

from sklearn.tree import DecisionTreeClassifier
dtree = DecisionTreeClassifier(max_depth=8)
dtree.fit(x_train,y_train)

predictions = dtree.predict(x_test)

ようやく6000番台に突入。

Related posts:

wordpress-xmlrpc

graphvizによる決定木の表示

配列をリストから生成

-Python
-Kaggle, Python

執筆者：admin

comment コメントをキャンセル

関連記事

: pythonからoffice365 smtpを利用してメールを送信

Office365の設定はこちらにある。 PythonにおけるSMTPの利用はこちらにある。下記はサンプルコード import smtplib from email.mime.text import …

: numpyのインポートおよび環境確認

機械学習をする際には必須のnumpy。まずはインポートして利用できるようにする。 import numpy as np # 正しくインポートされれば基本的にはメッセージが出てこない。逆に下記のような …

: タイタニックデータでEDA-2

前回は、タイタニックデータについてはビジュアライズしてデータについて理解を深めた。今回はデータをいじって機械学習に使えるようにする。機械学習をするために必要な処理は３つある。 null値の置換余 …

: python data scientist bootcamp

pythonでdata分析をしたいと思ったが学校に通う時間もお金もない。udemyで検索したところ英語版であるが1400円！でコースが見つかったのでこちらを受けることにした。 https://www. …

: pandaの基本中の基本操作

numpyとpandaのインポート import numpy as np import pandas as pd 前準備 labels = [‘a’, ‘b’, ‘c’] mydata = [10,2 …

PREV: kaggle Titanic Tutorial – 4
NEXT: kaggle Titanic Tutorial – 6

GIMPでForeground color pickerが正しくない色をピックアップするときの対応方法 2021年9月7日
lerpとslerpの違い 2021年8月5日
シェーダーとは 2021年8月3日
Unityの座標系についてメモ 2021年7月1日
ALLとREMOVEFILTERSの違い 2021年6月28日