Klasifikasi Komentar Body Shaming Beauty Vlogger Pada YouTube Menggunakan Metode BM25 Dan K-Nearest Neighbor
Main Author: | Prana, Pengkuh Aditya |
---|---|
Format: | Thesis NonPeerReviewed |
Terbitan: |
, 2019
|
Subjects: | |
Online Access: |
http://repository.ub.ac.id/171887/ |
ctrlnum |
171887 |
---|---|
fullrecord |
<?xml version="1.0"?>
<dc schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd"><relation>http://repository.ub.ac.id/171887/</relation><title>Klasifikasi Komentar Body Shaming Beauty Vlogger Pada
YouTube Menggunakan Metode BM25 Dan K-Nearest Neighbor</title><creator>Prana, Pengkuh Aditya</creator><subject>001.012 Classification</subject><description>Beauty vlogger merupakan sebutan untuk orang yang melakukan kegiatan
vlog untuk membahas masalah kecantikan dan tutorial make up di YouTube. Para
beauty vlogger sering mendapatkan komentar body shaming. Di Indonesia
komentar body shaming merupakan sebuah pelanggaran yang diatur dalam
Undang-Undang Informasi dan Transaksi Elektronik (UU ITE). Sistem klasifikasi
komentar body shaming dapat membantu untuk mengklasifikasi komentar body
shaming dengan lebih efisien dan lebih cepat. Tahapan yang dilakukan dalam
penelitian ini adalah melakukan pre-processing pada setiap data untuk mencari
kata yang menjadi ciri khas untuk setiap data, lalu menghitung term frequency
berdasarkan pada jumlah kata yang terdapat pada setiap data, selanjutnya
menghitung inverse document frequency , kemudian menghitung score BM25 dan
diurutkan, tahap terakhir melakukan klasifikasi K-Nearest Neighbor. Penelitian ini
menggunakan 600 data komentar dengan jumlah 300 data kelas body shaming,
dan 300 data kelas tidak body shaming. Rata-rata dari keseluruhan pengujian kfold
cross validation didapatkan nilai yang tertinggi yaitu precision=0,87153019,
recall=0,86666667, f-measure=0,86606885, dan akurasi=0,86666667 pada nilai
k=3. Nilai pengujian dengan menggunakan data seimbang jauh lebih baik dari pada
pengujian dengan menggunakan data tidak seimbang, dengan nilai rata-rata
tertinggi dari pengujian data tidak seimbang yaitu precision = 0,84306693, recall =
0,775, f-measure = 0,7582337, dan akurasi = 0,775.</description><date>2019-07-22</date><type>Thesis:Thesis</type><type>PeerReview:NonPeerReviewed</type><identifier> Prana, Pengkuh Aditya (2019) Klasifikasi Komentar Body Shaming Beauty Vlogger Pada YouTube Menggunakan Metode BM25 Dan K-Nearest Neighbor. Sarjana thesis, Universitas Brawijaya. </identifier><relation>SKR/FILKOM/2019/409/051905727</relation><recordID>171887</recordID></dc>
|
format |
Thesis:Thesis Thesis PeerReview:NonPeerReviewed PeerReview |
author |
Prana, Pengkuh Aditya |
title |
Klasifikasi Komentar Body Shaming Beauty Vlogger Pada
YouTube Menggunakan Metode BM25 Dan K-Nearest Neighbor |
publishDate |
2019 |
topic |
001.012 Classification |
url |
http://repository.ub.ac.id/171887/ |
contents |
Beauty vlogger merupakan sebutan untuk orang yang melakukan kegiatan
vlog untuk membahas masalah kecantikan dan tutorial make up di YouTube. Para
beauty vlogger sering mendapatkan komentar body shaming. Di Indonesia
komentar body shaming merupakan sebuah pelanggaran yang diatur dalam
Undang-Undang Informasi dan Transaksi Elektronik (UU ITE). Sistem klasifikasi
komentar body shaming dapat membantu untuk mengklasifikasi komentar body
shaming dengan lebih efisien dan lebih cepat. Tahapan yang dilakukan dalam
penelitian ini adalah melakukan pre-processing pada setiap data untuk mencari
kata yang menjadi ciri khas untuk setiap data, lalu menghitung term frequency
berdasarkan pada jumlah kata yang terdapat pada setiap data, selanjutnya
menghitung inverse document frequency , kemudian menghitung score BM25 dan
diurutkan, tahap terakhir melakukan klasifikasi K-Nearest Neighbor. Penelitian ini
menggunakan 600 data komentar dengan jumlah 300 data kelas body shaming,
dan 300 data kelas tidak body shaming. Rata-rata dari keseluruhan pengujian kfold
cross validation didapatkan nilai yang tertinggi yaitu precision=0,87153019,
recall=0,86666667, f-measure=0,86606885, dan akurasi=0,86666667 pada nilai
k=3. Nilai pengujian dengan menggunakan data seimbang jauh lebih baik dari pada
pengujian dengan menggunakan data tidak seimbang, dengan nilai rata-rata
tertinggi dari pengujian data tidak seimbang yaitu precision = 0,84306693, recall =
0,775, f-measure = 0,7582337, dan akurasi = 0,775. |
id |
IOS4666.171887 |
institution |
Universitas Brawijaya |
affiliation |
mill.onesearch.id fkp2tn.onesearch.id |
institution_id |
30 |
institution_type |
library:university library |
library |
Perpustakaan Universitas Brawijaya |
library_id |
480 |
collection |
Repository Universitas Brawijaya |
repository_id |
4666 |
subject_area |
Indonesian Language Collection/Kumpulan Karya Umum dalam Bahasa Indonesia* |
city |
MALANG |
province |
JAWA TIMUR |
shared_to_ipusnas_str |
1 |
repoId |
IOS4666 |
first_indexed |
2021-10-28T06:55:47Z |
last_indexed |
2021-10-28T06:55:47Z |
recordtype |
dc |
_version_ |
1751454114973220864 |
score |
17.538404 |