Proyek
Analisis dan Prediksi Permasalahan Attrition Rate Karyawan
Proyek ini menyelesaikan permasalahan tingkat attrition (tingkat pengurangan jumlah) karyawan yang mencapai lebih dari 10% melalui analisis mendalam dengan output berupa business dashboard dan prediksi attrition menggunakan machine learning, serta beberapa rekomendasi tindakan yang dapat diterapkan oleh perusahaan.
Analisis dan Prediksi Permasalahan Siswa Dropout
Proyek ini menyelesaikan permasalahan tingkat putus sekolah (dropout) mahasiswa yang cukup tinggi, mencapai lebih dari 32%, melalui analisis mendalam dengan output berupa business dashboard dan prediksi status mahasiswa menggunakan machine learning, serta beberapa rekomendasi tindakan yang dapat diterapkan oleh institusi.
Deteksi Penyakit Stroke
Mengembangkan dan menerapkan model deteksi stroke menggunakan Predictive Analytics dan Machine Learning Operations (MLOps), dengan tingkat akurasi mencapai 96%. Mengevaluasi kinerja model menggunakan metrik AUC, Binary Accuracy, TFMA, dan komponen confusion matrix. Berfokus pada peningkatan deteksi dini bagi individu berisiko tinggi serta memperkaya wawasan di bidang kesehatan melalui diagnostik berbasis machine learning.
Klasifikasi Tweets Bencana
Mengembangkan dan menerapkan model klasifikasi tweet bencana menggunakan Natural Language Processing (NLP) dan Machine Learning Operations (MLOps), dengan tingkat akurasi mencapai 86%. Mengevaluasi kinerja model menggunakan metrik AUC, Binary Accuracy, TFMA, dan komponen confusion matrix. Berfokus pada pendeteksian berita palsu atau hoax yang dapat dengan cepat menyebar di platform yang banyak digunakan seperti Twitter tentang bencana alam.
Dashboard Analisis Berbagi Sepeda
Proyek ini merupakan bagian dari proyek analisis data bike-sharing (sistem berbagi sepeda) untuk menganalisis Bike Sharing Dataset. Hasil analisis kemudian dibuat dalam bentuk visualisasi data ke dalam dashboard interaktif.
Sistem Rekomendasi Buku
Mengembangkan sistem rekomendasi buku canggih untuk meningkatkan minat baca, memanfaatkan data dari AWS. Mengimplementasikan Content-Based Filtering dengan TF-IDF dan Cosine Similarity serta Collaborative Filtering kustom menggunakan RecommenderNet dengan metrik Binary Cross-entropy dan Root Mean Squared Error (RMSE). Optimasi pra-pemrosesan data untuk meningkatkan akurasi rekomendasi. Insight menarik: permintaan buku tertinggi di Desember (12%), terendah di Juni (6%).
Analisis Prediktif Listrik
Mengembangkan model machine learning untuk memprediksi konsumsi listrik di Tétouan, Maroko, menggunakan data cuaca. Menganalisis 52.416 observasi dari tiga zona dan mengidentifikasi korelasi utama. Random Forest unggul dibandingan model lain dengan Root Mean Squared Error (RMSE) sebesar 24,15 (train) dan 39,28 (test). Proyek ini berkontribusi pada tantangan efisiensi energi dan mendukung pengelolaan sumber daya yang berkelanjutan.
Prakiraan Cuaca Chicago
Mengembangkan model deep learning menggunakan LSTM untuk memprediksi deret waktu cuaca di Chicago menggunakan 43.824 data. Dilatih dengan Stochastic Gradient Descent (SGD) optimizer, Huber loss, dan metrik Mean Absolute Error (MAE), mendapatkan MAE sebesar 2,2306 dan MAE validasi sebesar 1,7385. Juga menerapkan early stopping untuk mengoptimalkan pelatihan model.
Klasifikasi Berita dengan NLP
Mengembangkan model deep learning menggunakan Bi-LSTM untuk klasifikasi topik berita (dunia, olahraga, bisnis, dan sains-teknologi) sebanyak 120.000 data. Menerapkan pembersihan data, dilatih dengan Adam optimizer dan categorical cross-entropy loss, mencapai akurasi 97,27%. Menerapkan ReduceLROnPlateau untuk pengoptimalan pelatihan model
Klasifikasi Gambar Gunting-Batu-Kertas
Mengembangkan model deep learning menggunakan Convolutional Neural Network (CNN) untuk mengklasifikasikan gambar tangan gunting, batu, dan kertas. Dilatih dengan 2.188 data gambar (rasio 60:40) dengan Adam optimizer dan categorical cross-entropy loss. Mencapai akurasi 97,62% dan akurasi validasi 98,75% dalam 20 epoch