Abstract
Clickbait saat ini telah menjadi pendekatan yang umum atau populer dalam jurnalisme atau media online pada umumnya dan terbukti memberi dampak yang buruk terhadap masyarakat. Hal ini diamplifikasi dengan adanya sosial media seperti Twitter dan Facebook sehingga memberikan dampak yang lebih luas. Sayangnya, masih sedikit penelitian yang bertujuan untuk menjawab permasalahan tersebut. Dikarenakan dataset yang belum tersedia khususnya Bahasa Indonesia. Gap antara ketersediaan dataset untuk clickbait Bahasa Indonesia dan Inggris cukup jauh. Namun, dalam beberapa tahun terakhir penelitian menggunakan pre-trained model terbukti dapat membantu menjawab permasalahan tersebut. Dimana pre-trained model telah dilatih terlebih dahulu dengan menggunakan data tanpa label dengan jumlah yang besar. Oleh karena itu, penelitian ini berfokus pada eksplorasi untuk arsitektur dan algoritma deep learning untuk membuat model klasifikasi clickbait. Dimana, model yang diusulkan merupakan improvisasi model dari penelitian sebelumnya. Mengingat dataset yang kecil, penelitian ini akan menggunakan teknik balancing dan juga augmentasi untuk menghindari overfitting. Selain itu, model yang diajukan akan dievaluasi serta dibandingkan dengan model deep learning dan machine learning untuk melihat efektifitas dari model tersebut.