Implementasi Opinion Mining (Sentiment Analysis) untuk Ekstraksi Data Opini Publik pada Perguruan Tinggi
Main Author: | Rozi, ImamFahrur |
---|---|
Format: | Thesis NonPeerReviewed |
Terbitan: |
, 2012
|
Subjects: | |
Online Access: |
http://repository.ub.ac.id/155426/ |
Daftar Isi:
- Sentiment analysis atau opinion mining merupakan topik riset yang penting dan sedang marak diteliti saat ini. Opinion mining merupakan cabang dari text mining . Fokus dari opinion mining adalah melakukan analisis opini dari suatu dokumen teks. Dalam dunia bisnis, opinion mining banyak digunakan untuk menganalisis secara otomatis opini pelanggan tentang produk dan pelayanannya. Pada penelitian ini dikembangkan sistem opinion mining untuk menganalisis opini publik pada perguruan tinggi. Sistem dirancang sebagai aplikasi berbasis web dengan memiliki tiga subproses yaitu, document subjectivity (deteksi opini), opinion orientation (klasifikasi orientasi opini negatif dan positif) dan target detection (deteksi objek yang menjadi target opini). Pada subproses document subjectivity dan target detection digunakan Part-of-Speech (POS) Tagging menggunakan Hidden Markov Model (HMM). Dari POS Tagging akan dihasilkan kalimat yang sudah diberikan tag (kelas kata) pada masing-masing kata penyusun kalimat tersebut. Pada hasil proses POS Tagging kemudian diterapkan rule untuk mengetahui apakah suatu dokumen termasuk opini atau bukan, serta untuk mengetahui bagian kalimat mana yang merupakan objek yang menjadi target opini. Rule yang digunakan dalam penelitian ini didapatkan dari hasil observasi peneliti terhadap susunan kalimat-kalimat opini. Dokumen yang dikenali sebagai opini selanjutnya akan diklasifikasikan ke dalam opini negatif dan positif (subproses opinion orientation ) menggunakan Naïve Bayes Classifier (NBC). Pada proses training HMM digunakan tagged dataset (corpus) hasil penelitian sebelumnya. Tagged corpus berupa kumpulan kalimat yang telah diberikan tag pada setiap kata penyusunnya. Sedangkan pada proses training NBC digunakan opinion dataset yang dikumpulkan menggunakan kuisioner online sejumlah 575 data opini . Opinion dataset berupa kumpulan teks opini yang telah diklasifikasikan ke dalam klasifikasi negatif. Dari proses training HMM akan dihasilkan model probabilistik yang akan dijadikan acuan dalam proses tagging. Sedangkan dari proses training NBC akan dihasilkan model probabilistik sebagai acuan proses klasifikasi suatu teks opini. Parameter uji yang digunakan dalam penelitian ini adalah precission dan recall. Nilai precission dan recall menunjukkan akurasi sistem yang dibangun. Pada pengujian subproses document subjectivity dan target detection digunakan dua macam dataset POS Tagging, yaitu dataset dari UI dan dataset hasil modifikasi peneliti terhadap hasil penelitian sebelumnya. Pada kedua pengujian tersebut digunakan 575 data opini yang juga digunakan sebagai dataset untuk proses training NBC. Dengan menggunakan dataset dari UI, didapatkan nilai precission dan recall untuk subproses document subjectivity adalah 0.99 dan 0.72. Jika menggunakan dataset hasil modifikasi peneliti dihasilkan precission 0.99 dan recall 0.88. Pada pengujian subproses target detection , dengan menggunakan dataset dari UI didapatkan nilai precission berkisar 0.92 dan recall berkisar 0.93. Jika menggunakan dataset hasil modifikasi peneliti dihasilkann nilai precission 0.99 dan recall 0.97. Pada proses pengujian opinion orientation digunakan 87 data uji opini yang belum diklasifikasikan negatif atau positif. Data tersebut juga dikumpulkan melalui kuisioner online . Dari proses pegujian subproses opinion orientation didapatkan nilai precission dan recall sebesar 0.95 dan 0.94. Mengacu dari nilai precission dan recall yang didapatkan dari hasil pengujian, dapat dikatakan bahwa secara kualitatif akurasi sistem adalah baik.