Web Scraping pada Situs Wikipedia menggunakan Metode Ekspresi Regular

Main Author: Utomo, Mardi Siswo
Format: Article application/pdf eJournal
Bahasa: eng
Terbitan: FTI Unisbank , 2013
Subjects:
Online Access: http://www.unisbank.ac.id/ojs/index.php/fti1/article/view/1703
Daftar Isi:
  • Teknik scraping dapat dilakukan teknik regular ekspresi, regular ekspresi ditentukan pola yang mengawali dan mengakhiri suatu konten utama pada halaman situs. Salah satu situs yang mempunyai berbagai macam informasi yang akan digunakan sebagai obyek scraping adalah wikipedia. Salah satu situs yang mempunyai berbagai macam informasi yang akan digunakan sebagai obyek scraping adalah wikipedia. Wikipedia sendiri adalah proyek ensiklopedia multibahasa dalam jaringan yang bebas dan terbuka. Kemampuan dari aplikasi web scraping adalah Sistem berupa fungsi menggunakan aplikasi berbasis web digunakan untuk melakukan proses web scraping, Menggunakan CMS wordpress sebagai manajemen kontennya, Terimplementasi di dalam wordpress sebagai plugin. Pada akhirnya untuk dapat di rangking dengan bagus oleh mesin pencari dibutuhkan konten unik, karena dengan teknik web scraping konten yang dihasilkan tidak unik maka teknik ini website tidak dapat menjadi urutan awal pada hasil mensin pencari Kata Kunci : Web Scraping, Web Mining, Regular Ekspresi