科学の箱

科学・IT・登山の話題

Python

kaggle Titanic Tutorial – 11

投稿日:2018年6月12日 更新日:

kaggleで人気があるlightGBMをつかってみる。

 

インストール


pip install lightgbm

特に問題がなく終了。

コード、関係するところだけ記載。


split_before_y = d_train["Survived"].values
split_before_x = d_train.drop("Survived",axis=1)

X_train,X_test,y_train,y_test = train_test_split(split_before_x,split_before_y,test_size=0.008,random_state=0)

import lightgbm as lgb

lgb_train = lgb.Dataset(X_train, y_train)
lgb_eval = lgb.Dataset(X_test, y_test, reference=lgb_train)

params = {
'task': 'train',
'boosting_type': 'gbdt',
'objective': 'regression',
'metric': {'l2'},
'num_leaves': 200,
'learning_rate': 0.003,
'feature_fraction': 0.50,
'bagging_fraction': 0.80,
'bagging_freq': 7,
'verbose': 0
}
gbm = lgb.train(params, lgb_train, num_boost_round=1000, valid_sets=lgb_eval, early_stopping_rounds=200)

Y_pred = gbm.predict(d_test.drop("PassengerId",axis=1).copy(), num_iteration=gbm.best_iteration)

for i in range(418):
if Y_pred[i]>=0.51:
Y_pred[i]=
else:
Y_pred[i]=0

kaggle_submission = pd.DataFrame({
"PassengerId": d_test["PassengerId"],
"Survived": Y_pred.astype('int64')
})

 

結果は大幅な改善。0.80861となった。

メタ情報

inarticle



メタ情報

inarticle



-Python
-,

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

model.coef_の確認

重回帰分析で重みを確認するには下記を利用する。 model.coef_ ただしこれだと有効桁数が分かりにくいので有効桁数を3桁にして、さらに指数を展開する。 np.set_printoptions(p …

no image

dataframeで条件を付けて要素を返す方法

前回の続きから。 dfは現在以下のようになっている。 W X Y Z A 2.706850 0.628133 0.907969 0.503826 B 0.651118 -0.319318 -0.848 …

no image

pythonからoffice365 smtpを利用してメールを送信

Office365の設定はこちらにある。 PythonにおけるSMTPの利用はこちらにある。 下記はサンプルコード import smtplib from email.mime.text import …

no image

タイタニックデータでEDA

タイタニックデータでEDAを実施する。 まずはライブラリの読み込み import pandas as pd import numpy as np import matplotlib.pyplot as …

no image

pythonで配列に関係する型

pythonで配列に関連する型は3つある。 list array numpy.ndarray pandas.dataframe list 違っている複数のデータ型を要素として保持できる 多次元配列可能 …

2018年6月
« 5月   9月 »
 123
45678910
11121314151617
18192021222324
252627282930  

side bar top



アーカイブ

カテゴリー