Abstract
Ketersediaan dokumen digital yang semakin meluas dengan adanya akses Web semakin membuka peluang untuk melakukan plagiarisme. Penelitian ini bertujuan untuk membuat model pendeteksian plagiarisme menggunakan pembelajaran ensemble. Metode ensemble menggabungkan beberapa model, dalam penelitian ini adalah model klasifikasi, untuk mendapatkan prediksi kinerja yang lebih baik daripada menggunakan satu model saja. Langkah yang dilakukan adalah menghitung tingkat kemiripan antara dokumen acuan dan dokumen testing yang diangap plagiat. Hasil dari serangkaian similarity testing akan digunakan sebagai input untuk training dan validasi terhadap model klasifikasi. Training dan validasi tersebut akan dilakukan dengan menggunakan beberapa algoritma klasifikasi. Hasil dari beberapa algoritma tersebut akan digabungkan dengan metoda ensemble untuk mendapatkan kinerja yang lebih baik.
Keywords
Plagiarisme, ensemble, neural network, similarity measure, model