科学の箱

科学・IT・登山の話題

Python

kaggle Titanic Tutorial – 11

投稿日:2018年6月12日 更新日:

kaggleで人気があるlightGBMをつかってみる。

 

インストール


pip install lightgbm

特に問題がなく終了。

コード、関係するところだけ記載。


split_before_y = d_train["Survived"].values
split_before_x = d_train.drop("Survived",axis=1)

X_train,X_test,y_train,y_test = train_test_split(split_before_x,split_before_y,test_size=0.008,random_state=0)

import lightgbm as lgb

lgb_train = lgb.Dataset(X_train, y_train)
lgb_eval = lgb.Dataset(X_test, y_test, reference=lgb_train)

params = {
'task': 'train',
'boosting_type': 'gbdt',
'objective': 'regression',
'metric': {'l2'},
'num_leaves': 200,
'learning_rate': 0.003,
'feature_fraction': 0.50,
'bagging_fraction': 0.80,
'bagging_freq': 7,
'verbose': 0
}
gbm = lgb.train(params, lgb_train, num_boost_round=1000, valid_sets=lgb_eval, early_stopping_rounds=200)

Y_pred = gbm.predict(d_test.drop("PassengerId",axis=1).copy(), num_iteration=gbm.best_iteration)

for i in range(418):
if Y_pred[i]>=0.51:
Y_pred[i]=
else:
Y_pred[i]=0

kaggle_submission = pd.DataFrame({
"PassengerId": d_test["PassengerId"],
"Survived": Y_pred.astype('int64')
})

 

結果は大幅な改善。0.80861となった。

メタ情報

inarticle



メタ情報

inarticle



-Python
-,

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

bing image searchをpythonで利用

Azureへの登録+Bing Search APIを登録についてはこちらのサイトが詳しい。 https://qiita.com/ysdyt/items/49e99416079546b65dfc ただし …

no image

数字、計算、文字列を画面出力

Hello Worldができたので、いろいろな出力を試してみる。 出力はprint関数を使えばよい。 まずは数値から試してみる。数値は文字列と違い引用符で囲む必要はない。画面に直接表示するので変数は使 …

no image

wordpress-xmlrpc

WordPressへPythonから投稿してみる。 まずは設定から。説明はこちらにある。 https://python-wordpress-xmlrpc.readthedocs.io/en/lates …

no image

pythonでTensorFlowを使うまで

TensorFlowが利用できるまでの設定手順をまとめる。 まず基本となるインストラクションはこちらにある。 https://www.tensorflow.org/install/pip このインスト …

no image

K近傍法でデータを分析

K近傍法の手順 データ読み込み EDA スケーリング K選択前処理 モデル評価 K選択 モデル構築   K近傍法でデータを分析する際にはseabornのpairplotが役に立つ df = …

2018年6月
« 5月   9月 »
 123
45678910
11121314151617
18192021222324
252627282930  

side bar top



アーカイブ

カテゴリー