Analisis Penggunaan Metode Latent Dirichlet Allocation (LDA) Menggunakan Pendekatan Collapsed Gibbs Sampling Untuk Pemodelan Topik Abstrak Dokumen Laporan Tugas Akhir

Format: Bachelors
Terbitan: #CREATOR_ORGNAME# , 2018
Subjects:
Daftar Isi:
  • Mahasiswa Tingkat Akhir Jurusan Teknik Komputer setiap tahunnya mengerjakan tugas akhir. Tugas akhir tersebut merupakan salah satu syarat kelulusan. Untuk mengerjakan tugas akhir dibutuhkan referensi-referensi, salah satunya adalah dokumen tugas akhir tahun-tahun sebelumnya. Untuk mencari dokumen tugas akhir tersebut Jurusan Teknik Komputer hanya memperlihatkan katalog yang berisi judul-judul Tugas Akhir. Permasalahannya adalah tidak semua judul yang diberikan menggambarkan isi dari dokumen tersebut. Sehingga dibutuhkan cara untuk menemukan referensi yang tepat. Salah satu cara dalam mengatasi masalah tersebut adalah dengan pemodelan topik. Pada penelitian sebelumnya telah dilakukan penelitian pemodelan topik dengan metode Robust Probabilistic Latent Semantic Analysis (RPLSA) yang merupakan perluasan Probabilistic Latent Semantic Analysis (PLSA) dengan penanganan overfitting pada tugas akhir lalu. Dari referensi penelitian pada bidang pemodelan topik didapatkan kesimpulan bahwa perluasan PLSA dapat dilakukan juga dari pendekatan lain yang disebut Latent Dirichlet Allocation (LDA). Namun LDA membutuhkan metode untuk estimasi topik karena tidak bisa diimplementasikan. Terdapat metode untuk estimasi topik yaitu dengan menggunakan pendekatan Collapsed Gibbs Sampling. Untuk mengetahui seberapa bagus metode tersebut diukur relevansi dengan membandingkan pengelompokan dokumen menggunakan Collapsed Gibbs Sampling dan pengelompokan dokumen menggunakan judgement dari ahli yaitu pembimbing/penguji dari dokumen laporan tugas akhir yang mengetahui topik dari dokumen tersebut. Dari penelitian yang sudah dilakukan didapatkan hasil relevansi dari metode Collapsed Gibbs Sampling sebesar 52.5% jika dibandingkan dengan judgement manusia dengan menggunakan data berupa abstrak dokumen tugas akhir. Kata Kunci: Topic Modeling, Latent Dirichlet Allocation, Collapsed Gibbs Sampling.