Prediksi Masa Studi Mahasiswa Menggunakan Random Forest Dengan Seleksi Fitur RF-RFE (Recursive Feature Elimination) dan Particle Swarm Optimization

Main Authors: Krisnabayu, Rifky Yunus, Dr. Drs. Achmad Ridok,, M.Kom., Agung Setia Budi,, S.T., M.T., Ph.D
Format: Thesis NonPeerReviewed Book
Bahasa: eng
Terbitan: , 2022
Subjects:
Online Access: http://repository.ub.ac.id/188256/1/Rifky%20Yunus%20Krisnabayu.pdf
http://repository.ub.ac.id/188256/
Daftar Isi:
  • Program Magister Ilmu Komputer/Informatika adalah salah satu jenjang pendidikan yang diselenggarakan Fakultas Ilmu Komputer Universitas Brawijaya. Program studi ini dapat ditempuh dalam kurun waktu 2 tahun atau 4 semester. Berdasarkan data akademik untuk angkatan 2015 - 2019, persentase mahasiswa yang mampu lulus tepat waktu (3-4 semester) berkisar 41%. Berdasarkan data, maka dapat disimpulkan bahwa jumlah mahasiswa yang lulus tidak tepat waktu lebih banyak dibandingkan mahasiswa yang dapat lulus tepat waktu. Total masa studi yang melebihi standar yang telah ditetapkan dapat mempengaruhi kualitas dari program studi tersebut yang umum disebut akreditasi. Permasalahan mahasiswa yang belum dapat lulus tepat waktu menjadi hal yang perlu dipertimbangkan. Selain memberikan solusi dengan perubahan peraturan tertentu, solusi yang lainnya yakni dengan memanfaatkan bidang ilmu pengetahuan seperti pembelajaran mesin (machine learning). Keluaran dari penelitian ini adalah masa studi mahasiswa dalam bentuk semester. Harapannya adalah ketika mahasiswa diprediksi lulus tidak tepat waktu, maka dapat diambil kebijakan pencegahan. Penelitian ini menggunakan random forest yang dikombinasikan dengan synthetic minority over-sampling technique (SMOTE) untuk resamping dataset, seleksi fitur menggunakan recursive feature elimination (RFE), serta hyperparameter optimization menggunakan particle swarm optimization (PSO). Dataset yang digunakan pada penelitian ini adalah dataset yang memuat nilai seleksi masuk calon mahasiswa yang berjumlah 97 baris data. Hasilnya didapatkan bahwa secara umum setiap metode yang ditambahkan mampu memberikan peningkatan performa. Model RF standar memberikan akurasi 0.55. RF + SMOTE memberikan peningkatan akurasi dari 0.55 menjadi 0.72 atau 30.9%. RF + SMOTE + RFE memberikan peningkatan akurasi dari 0.55 menjadi 0.78 atau 41.8%, dan terakhir RF + SMOTE + RFE + PSO mampu memberikan peningkatakan akurasi 0.55 menjadi 0.81 atau 47.2%. Hasilnya model random forest classifer (RFC) memberikan nilai akurasi, presisi, recall, dan f1-score secara berturut-turut adalah 0.81, 0.81, 0.82, dan 0.81. Hasil tersebut mampu mengungguli algoritma lainnya logistic regression, support vector machine, decision tree, dan lainnya pada pengujian yang telah dilakukan.