Kaggle: Titanic - Machine Learning from Disaster (https://www.kaggle.com/c/titanic/overview)
Data ini berisi 12 variabel, termasuk di dalamnya adalah variabel personal seperti id dan nama, serta variabel target berupa "Survived" (bernilai 0 dan 1). Tujuan yang ingin dicapai adalah memprediksi penumpang mana yang selamat (Survived = 1) dan penumpang mana saja yang tidak selamat (Survived = 0) dalam peristiwa kapal Titanic berdasarkan fitur yang ada.
Langkah-langkah yang saya lakukan adalah sebagai berikut:
- Import library dasar yang diperlukan
- Import dataset
- Exploratory Data Analysis (EDA)
- Feature Selection dengan menghapus beberapa fitur
- Feature Engineering yaitu mengatasi missing value, mengatasi variabel kategorik, dan melakukan penskalaan data
- Modelling dengan menggunakan K-Nearest Neighbors (K-NN) sekaligus evalusi model menggunakan nilai akurasi. Akan ada perbandingan beberapa model juga di sini
Terdapat artikel yang saya buat: https://wandalistathea.medium.com/prediksi-ketahanan-hidup-penumpang-kapal-titanic-menggunakan-k-nn-python-74862d03cd46
Score submission di Kaggle: 0.71531