Identifikasi Konten Pornografi Berbahasa Indonesia Menggunakan Algoritma Support Vector Machine (SVM)
Main Author: | Mahardika, Rendra |
---|---|
Other Authors: | Gunawan, Dani, Purnamawati, Sarah |
Format: | Bachelors application/pdf |
Bahasa: | ind |
Terbitan: |
Universitas Sumatera Utara
, 2018
|
Subjects: | |
Online Access: |
https://repositori.usu.ac.id/handle/123456789/8879 |
Daftar Isi:
- 141402022
- Kehadiran internet sebagi media informasi tidak hanya memberikan dampak positif bagi kehidupan masyarakat, namun juga memberikan dampak negatif seperti mudahnya masyarakat dalam mengakses berbagai konten pornografi. Di Indonesia, pornografi merupakan hal yang illegal. Sudah ada Undang-Undang yang mengatur tentang pornografi yaitu UU No. 44 Tahun 2008 Tentang Pornografi (UU Pornografi). Selain melanggar Undang-Undang, konten pornografi juga dapat merusak kepribadian dan perkembangan mental dari pihak yang mengaksesnya, terutama anak-anak yang belum mendapatkan pengetahuan seksual. Pemerintah Indonesia melalui Kementrian Komunikasi dan Informatika Indonesia sudah berusaha dalam mencegah penyebaran konten negatif khususnya konten pornografi di Indonesia melalui internet dengan cara membuat layanan DNS (Domain Name System) Nawala dan Layanan Trust Positif. Namun, layanan ini dinilai kurang efektif karena hanya mendeteksi berdasarkan URL laman web dan pengaduan dari masyarakat. Pengembangan metode klasifikasi berdasarkan isi dari laman web terus dilakukan untuk mencari metode yang tepat dengan akurasi yang lebih baik. Pada penelitian ini dikembangkan metode untuk mengidentifikasi konten pornografi pada website berbahasa Indonesia menggunakan algoritma Support Vector Machine (SVM). Tahapan keseluruhan metode yang digunakan adalah preprocessing yang meliputi case folding dan tokenizing serta identifikasi menggunakan Support Vector Machine. Penelitian ini menghitung nilai akurasi dari model klasifikasi yang dibangun dengan dataset yang telah divalidasi dengan metode cross-validation. Hasil pengujian pada penelitian ini menunjukkan metode Support Vector Machine dapat mengidentifikasi konten pornografi dengan tingkat akurasi dari evaluasi model klasifikasi sebesar 98.25% dan tingkat precision sebesar 98.5% dari pengujian 200 kalimat.
- The presence of the internet as an information media not only has a positive impact on people's lives, but also has a negative impact such as the ease of the community in accessing various pornographic content. In Indonesia, pornography is illegal. There are already laws regulating pornography, Undang-Undang No. 44 Tahun 2008 concerning Pornography (Pornography Law). In addition to violating the Law, pornographic content can also damage the personality and mental development of those who access it, especially children who have not gained sexual knowledge. The Indonesian government, through Kementrian Komunikasi dan Informatika Indonesia, has been trying to prevent the spread of negative content, especially pornographic content in Indonesia through the internet, by creating Newsletter DNS (Domain Name System) services and Positive Trust Services. However, this service is considered less effective because it only detects based on the URL of web pages and complaints from the public. Development of methods by classifying based on the contents of web pages continues to be done to find the right method with better accuracy. In this study a system was developed to identify pornographic content on Indonesian-language websites using the Support Vector Machine (SVM) algorithm. The overall stages of the method used are preprocessing which includes case folding and tokenizing and identification using Support Vector Machine. This study compares the results of the F-Score trial on the classification of pornographic content using a model that has been validated by the cross-validation method. The test results in this study indicate that the Support Vector Machine method can identify pornographic content with the accuracy of the classification model evaluation of 98.25% and the precision level of 98.5% of the 200 sentences test.