Daftar Isi:
  • Bahasa merupakan alat komunikasi untuk bisa saling berhubungan satu sama lain. Dengan bahasa manusia dapat membuat sebuah karya, salah satunya dalam bentuk tulisan. Tulisan yang dibuat berupa penelitian yang dimuat dalam bahasa publikasi. Bahasa publikasi dibedakan menjadi dua macam diantaranya adalah bahasa publikasi nasional dan internasional. Publikasi nasional yaitu publikasi yang dibuat oleh penulis berdasarkan asal negara pembuat. Publikasi internasional adalah publikasi yang dibuat penulis dengan menggunakan bahasa yang banyak diakui oleh banyak negara. Dan ditulis dengan menggunakan bahasa resmi perserikatan bangsa-bangsa yaitu Arab, Inggris, Perancis, Rusia, Spanyol, dan Tiongkok. Oleh karena itu pentingnya sebuah dokumen untuk mengklasifikasikan kedalam bahasa publikasi nasional atau internasional.Untuk itu diperlukan sebuah sistem yang dapat membedakan bahasa. Salah satunya dengan membuat sebuah sistem Identifikasi bahasa publikasi menggunakan jaringan syaraf tiruan berbasis unigram. sistem tersebut mampu membedakan bahasa penulisan. Bahasa penulisan akan di ekstract dengan menggunakan unigram, kemudian diterapkan metode jaringan syaraf tiruan untuk mengambil sebuah keputusan. Jaringan syaraf tiruan merupakan salah satu metode kecerdasan buatan. Prosesnya terdiri dari preprocessing, training dan testing serta evaluasi hasil. Sehingga hasilnya, sistem akan mampu mengenali bahasa penulisan tersebut. Dokumen berbahasa indonesia akan menghasilkan angka diatas sama dengan 0.5 dan dokumen berbahasa inggris menghasilkan angka dibawah 0.5. Hasil evaluasi precision bahasa indonesia 98.4% dan bahasa inggris 98%. Untuk recall bahasa indonesia 98% dan bahasa inggris 98.4%. Kata Kunci : Bahasa, Jaringan Syaraf Tiruan, Unigram, preprocessing, Training