Peningkatan Algoritma Porter Stemmer Bahasa Indonesia berdasarkan Metode Morfologi dengan Mengaplikasikan 2 Tingkat Morfologi dan Aturan Kombinasi Awalan dan Akhiran

Main Authors: Wiguna, Putu Bagus Susastra; Mahasiswa Pascasarjana Teknik Elektro, Jurusan Teknik Elektro dan Teknologi Informasi Fakultas Teknik Universitas Gadjah Mada, Jln. Grafika 2 Yogyakarta 55281 INDONESIA telp:0274-552305, Hantono, Bimo Sunarfri; Dosen Jurusan Teknik Elektro dan Teknologi Informasi Fakultas Teknik Universitas Gadjah Mada, Jln. Grafika 2 Yogyakarta 55281 INDONESIA telp: 0274-552305; fax: 0274- 552305
Format: Article info application/pdf eJournal
Bahasa: eng
Terbitan: Jurusan Teknik Elektro dan Teknologi Informasi, Fakultas Teknik, Universitas Gadjah Mada , 2014
Online Access: http://ejnteti.jteti.ugm.ac.id/index.php/JNTETI/article/view/49
http://ejnteti.jteti.ugm.ac.id/index.php/JNTETI/article/view/49/83
Daftar Isi:
  • Abstract— Stemmer has been used in document processing like: information retrieval, question answering, spell checking, language translator, document clustering, document classification. Stemmer method based on word morphology has some lack such as: incorrect prefix removal on root words beginning with the letter “k”, “t”, “s” and “p”, Incorrect suffix removal especially for “-kan” and “-an” suffix. To handle these problems, this research proposes a stemmer that uses two level morphology to root word beginning with the letter “k”, “t”, “s”, “p” and use prefix and suffix combination rules to remove suffix on a word. Example: “di-” as the prefix should only be paired with “kan-” as the suffix and should not be paired with “-an” as the suffix. The experiments showed that the proposed stemmer accuracy was 95.5%, better than the earlier stemmer based on word morphology. The accuracy of earlier stemmer based on word morphology was 82.5%.Intisari— Stemmer telah digunakan secara luas dalampengolahan dokumen elektronik seperti: sistem temu kembali informasi (information retrieval), question answering, pemeriksaan ejaan, mesin penerjemah, clustering dokumen, klasifikasi dokumen. Metode stemmer dengan menggunakan morfologi suatu kata memiliki beberapa kekurangan seperti tidak tepat menghilangkan awalan pada kata dasar yang berawalan huruf “k”, “t”, “s” dan “p” serta tidak tepat dalam menghilangkan akhiran terutama untuk akhiran “-kan” dan “-an.” Untuk menyelesaikan masalah ini, penelitian ini menawarkan penggunaan 2 tingkat morfologi pada kata dasar berawalan huruf “k”, “t”, “s” dan “p” serta menggunakan aturan kombinasi awalan dan akhiran untuk menghilangkan akhiran pada suatu kata seperti awalan “di-” hanya boleh dipasangkan dengan akhiran “-kan” dan tidak boleh dengan akhiran “-an” Hasil dari penelitian ini adalah stemmer yang memiliki tingkat akurasi 95,5%, lebih baik dibandingkan stemmer sebelumnya yang menggunakan algoritma berdasarkan morfologi suatu kata. Stemmer sebelumnya yang menggunakan algoritma berdasarkan morfologi suatu kata memiliki tingkat akurasi 82,5%.Kata Kunci— Stemmer, 2 tingkat morfologi, kombinasi awalan dan akhiran