科学の箱

科学・IT・登山の話題

Python

kaggle Titanic Tutorial – 9

投稿日:2018年6月3日 更新日:

さて今回は少し趣向を変えて別のアルゴリズムを試してみる。

アルゴリズムの試し方はこちらを参考にした。

https://www.kaggle.com/omarelgabry/a-journey-through-titanic?scriptVersionId=447794

関連するコードは以下の通り。


Y_train = d_train["Survived"].values
X_train = d_train.drop("Survived",axis=1)
X_test = d_test.drop("PassengerId",axis=1).copy()

from sklearn.tree import DecisionTreeClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC, LinearSVC
from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier
from sklearn.naive_bayes import GaussianNB
dtree = DecisionTreeClassifier(max_depth=8)
dtree.fit(x_train,y_train)
Y_pred = dtree.predict(X_test)
dtree.score(X_train, Y_train)

logreg = LogisticRegression()
logreg.fit(X_train, Y_train)
Y_pred = logreg.predict(X_test)
logreg.score(X_train, Y_train)

svc = SVC()
svc.fit(X_train, Y_train)
Y_pred = svc.predict(X_test)
svc.score(X_train, Y_train)

random_forest = RandomForestClassifier(n_estimators=100)
random_forest.fit(X_train, Y_train)
Y_pred = random_forest.predict(X_test)
random_forest.score(X_train, Y_train)

knn = KNeighborsClassifier(n_neighbors = 3)
knn.fit(X_train, Y_train)
Y_pred = knn.predict(X_test)
knn.score(X_train, Y_train)

gaussian = GaussianNB()
gaussian.fit(X_train, Y_train)
Y_pred = gaussian.predict(X_test)
gaussian.score(X_train, Y_train)

 

この結果として

DecisionTree : 0.89113355780022452

Logistic Regression : 0.80246913580246915

SVC : 0.90460157126823793

KNN : 0.84062850729517391

GaussianNB : 0.80808080808080807

とりあえず、SVCでサブミッションしてみる。

いまいちでした。

 

メタ情報

inarticle



メタ情報

inarticle



-Python
-,

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

cp932 error

pythonで入力ファイルにおける文字コードが正しく認識されない場合、以下のようなエラーがでる。 UnicodeDecodeError: ‘cp932’ codec can&# …

no image

初めてのmatplotlib

matplotlibを使えばpythonで様々なグラフをデータから作成できる。初めてのmatplotlibということで、単純なグラフを作成する。 まずはmatplotlibを読み込む >> …

no image

pipインストールでエラーが出る場合

pipインストールでエラーが出る場合 Collecting tensorflow WARNING: Retrying (Retry(total=4, connect=None, read=None, …

no image

NumPyを使ってみる

Pythonでデータ分析の勉強を始めるとまず初めに出てくるパッケージ numpy。これはそもそも何か。 numpyのuser documentを読みながらいじってみる。 https://docs.sc …

no image

python coding styleのツール

Pythonで使えるコーディングツール pep8 flake8 pylint   Related posts:Python + Slack Bot – 3Hello Worldを実行配列同士 …

2018年6月
« 5月   9月 »
 123
45678910
11121314151617
18192021222324
252627282930  

side bar top



アーカイブ

カテゴリー