NORMALISASI TEKS PADA CHATBOT SISTEM INFORMASI AKADEMIK MENGGUNAKAN ALGORITME DAMERAU– LEVENSHTEIN DISTANCE DAN PREFIX TREE (STUDI KASUS: UNIVERSITAS TEKNOKRAT INDONESIA) Text Normalization In Academic Information System Chatbot Using Damerau–Levenshtein Distance Algorithm And Prefix Tree (Case Study: Teknokrat University of Indonesia)
Main Author: | Yahya, Muhammad Thomas Fadhila |
---|---|
Format: | Thesis NonPeerReviewed Book Bachelors |
Bahasa: | eng |
Terbitan: |
, 2019
|
Subjects: | |
Online Access: |
http://repository.teknokrat.ac.id/2212/1/5.%20ABSTRAK.pdf http://repository.teknokrat.ac.id/2212/2/10.%20BAB%20I.pdf http://repository.teknokrat.ac.id/2212/3/15.%20DAFTAR%20PUSTAKA.pdf http://repository.teknokrat.ac.id/2212/ |
ctrlnum |
2212 |
---|---|
fullrecord |
<?xml version="1.0"?>
<dc schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd"><relation>http://repository.teknokrat.ac.id/2212/</relation><title>NORMALISASI TEKS PADA CHATBOT SISTEM INFORMASI
AKADEMIK MENGGUNAKAN ALGORITME DAMERAU–
LEVENSHTEIN DISTANCE DAN PREFIX TREE (STUDI KASUS:
UNIVERSITAS TEKNOKRAT INDONESIA)
Text Normalization In Academic Information System Chatbot Using
Damerau–Levenshtein Distance Algorithm And Prefix Tree (Case Study:
Teknokrat University of Indonesia)</title><creator>Yahya, Muhammad Thomas Fadhila</creator><subject>Algoritma dan Pemrograman</subject><description>Penelitian ini dilakukan atas dasar permasalahan pada chatbot yang sulit
memahami dan merespons pesan dengan tepat karena terdapat kesalahan
pengetikan, tata bahasa dan penggunaan bahasa yang buruk dalam pesan pengguna.
Oleh karena itu dibutuhkan sistem normalisasi teks yang dapat mengubah bentuk
pesan pengguna ke dalam bentuk baku. Dengan sistem ini diharapkan dapat
mengatasi permasalahan chatbot saat memahami dan merespons pesan.
Sistem ini terdiri tujuh tahapan normalisasi yaitu normalisasi garis baru,
normalisasi huruf kecil, normalisasi karakter berulang, normalisasi spasi,
tokenisasi, normalisasi kata dasar, dan pengecekan ejaan. Pada tahap pengecekan
ejaan, menggunakan algoritme Damerau–Levenshtein Distance untuk menghitung
jarak string dan fungsi Perhitungan Kedekatan Huruf. Prefix Tree digunakan untuk
mengubah data korpus ke dalam bentuk node.
Berdasarkan hasil penelitian dan implementasi, diketahui bahwa
menggunakan algoritme Damerau–Levenshtein Distance dan fungsi Perhitungan
Kedekatan Huruf menghasilkan nilai mean average precision sebesar 0,86. Dan
menggunakan Prefix Tree menghasilkan waktu proses sebesar 0.004 detik untuk
kata dengan panjang mulai dari 3 karakter, bertambah 0.002 detik untuk setiap
karakter. Untuk kata dengan panjang mulai dari 11 karakter, peningkatan waktu
proses berubah menjadi 0.003 detik untuk setiap karakter.</description><date>2019-12-15</date><type>Thesis:Thesis</type><type>PeerReview:NonPeerReviewed</type><type>Book:Book</type><language>eng</language><identifier>http://repository.teknokrat.ac.id/2212/1/5.%20ABSTRAK.pdf</identifier><type>Book:Book</type><language>eng</language><identifier>http://repository.teknokrat.ac.id/2212/2/10.%20BAB%20I.pdf</identifier><type>Book:Book</type><language>eng</language><identifier>http://repository.teknokrat.ac.id/2212/3/15.%20DAFTAR%20PUSTAKA.pdf</identifier><identifier> Yahya, Muhammad Thomas Fadhila (2019) NORMALISASI TEKS PADA CHATBOT SISTEM INFORMASI AKADEMIK MENGGUNAKAN ALGORITME DAMERAU– LEVENSHTEIN DISTANCE DAN PREFIX TREE (STUDI KASUS: UNIVERSITAS TEKNOKRAT INDONESIA) Text Normalization In Academic Information System Chatbot Using Damerau–Levenshtein Distance Algorithm And Prefix Tree (Case Study: Teknokrat University of Indonesia). Other thesis, Universitas Teknokrat Indonesia. </identifier><recordID>2212</recordID></dc>
|
language |
eng |
format |
Thesis:Thesis Thesis PeerReview:NonPeerReviewed PeerReview Book:Book Book Thesis:Bachelors |
author |
Yahya, Muhammad Thomas Fadhila |
title |
NORMALISASI TEKS PADA CHATBOT SISTEM INFORMASI
AKADEMIK MENGGUNAKAN ALGORITME DAMERAU–
LEVENSHTEIN DISTANCE DAN PREFIX TREE (STUDI KASUS:
UNIVERSITAS TEKNOKRAT INDONESIA)
Text Normalization In Academic Information System Chatbot Using
Damerau–Levenshtein Distance Algorithm And Prefix Tree (Case Study:
Teknokrat University of Indonesia) |
publishDate |
2019 |
topic |
Algoritma dan Pemrograman |
url |
http://repository.teknokrat.ac.id/2212/1/5.%20ABSTRAK.pdf http://repository.teknokrat.ac.id/2212/2/10.%20BAB%20I.pdf http://repository.teknokrat.ac.id/2212/3/15.%20DAFTAR%20PUSTAKA.pdf http://repository.teknokrat.ac.id/2212/ |
contents |
Penelitian ini dilakukan atas dasar permasalahan pada chatbot yang sulit
memahami dan merespons pesan dengan tepat karena terdapat kesalahan
pengetikan, tata bahasa dan penggunaan bahasa yang buruk dalam pesan pengguna.
Oleh karena itu dibutuhkan sistem normalisasi teks yang dapat mengubah bentuk
pesan pengguna ke dalam bentuk baku. Dengan sistem ini diharapkan dapat
mengatasi permasalahan chatbot saat memahami dan merespons pesan.
Sistem ini terdiri tujuh tahapan normalisasi yaitu normalisasi garis baru,
normalisasi huruf kecil, normalisasi karakter berulang, normalisasi spasi,
tokenisasi, normalisasi kata dasar, dan pengecekan ejaan. Pada tahap pengecekan
ejaan, menggunakan algoritme Damerau–Levenshtein Distance untuk menghitung
jarak string dan fungsi Perhitungan Kedekatan Huruf. Prefix Tree digunakan untuk
mengubah data korpus ke dalam bentuk node.
Berdasarkan hasil penelitian dan implementasi, diketahui bahwa
menggunakan algoritme Damerau–Levenshtein Distance dan fungsi Perhitungan
Kedekatan Huruf menghasilkan nilai mean average precision sebesar 0,86. Dan
menggunakan Prefix Tree menghasilkan waktu proses sebesar 0.004 detik untuk
kata dengan panjang mulai dari 3 karakter, bertambah 0.002 detik untuk setiap
karakter. Untuk kata dengan panjang mulai dari 11 karakter, peningkatan waktu
proses berubah menjadi 0.003 detik untuk setiap karakter. |
id |
IOS15511.2212 |
institution |
Universitas Teknokrat Indonesia |
institution_id |
1130 |
institution_type |
library:university library |
library |
Perpustakaan Universitas Teknokrat Indonesia |
library_id |
1718 |
collection |
Repository Universitas Teknokrat Indonesia |
repository_id |
15511 |
subject_area |
Repository Teknokrat Repository UTI Repository Universitas Teknokrat Indonesia |
city |
KOTA BANDAR LAMPUNG |
province |
LAMPUNG |
repoId |
IOS15511 |
first_indexed |
2021-05-20T04:53:02Z |
last_indexed |
2021-05-20T04:53:02Z |
recordtype |
dc |
merged_child_boolean |
1 |
_version_ |
1700252029911302144 |
score |
17.538404 |