Abstract
Pandemi Corona Virus Disease-19 (COVID-19) yang dimulai diawal tahun 2020 menuntut para peneliti untuk bergerak cepat dalam menanggulangin masalah ini dengan melakukan penelitian di segala bidang yang terkait. Salah satu contoh area penelitian yang sudah banyak dilakukan adalah penelitian yang menggunakan machine learning (ML) untuk menganalisa data terkait COVID-19. Penentuan topik penelitian menjadi hal pertama dan landasan penting dalam melakukan sebuah penelitian. Sangat penting bagi seorang peneliti untuk melakukan kajian literatur terhadap semua penelitian yang telah dilakukan untuk menghindari penelitian yang berulang. Namun dengan banyaknya data artikel ilmiah yang ada tentunya tidak mudah bagi seorang peneliti dalam melakukan review pada data tersebut. Hal ini membutuhkan waktu yang cukup lama bagi seorang peneliti dalam melakukan literatur ilmiah, sehingga membuat kita membutuhkan alat dan teknik untuk mengatur, mencari dan memahami sejumlah besar informasi mengenai penelitian yang sudah pernah dilakukan sebelumnya. Dalam penelitian ini, data artikel ilmiah yang termasuk judul, abstrak, dan beberapa metadata lainnya akan dikumpulan dari database SCOPUS dengan menggunakan keyword [Machine Learning AND COVID-19]. Selanjutnya dua metode utama yaitu Latent Dirichlet Algorithm (LDA) dan Structural Topic Modeling (STM) akan digunakan untuk menganalisa data teks tersebut secaraunsupervised. Pada akhirnya kumpulan artikel tersebut akan dibagi mejadi beberapa kelompok berdasarkan topik-topik yang mewakili kumpulan artikel imiah tersebut. Visualisasi dari hasil analisa data ini akan dilakukan untuk menampilkan kata-kata yang banyak muncul di tiap kelompok untuk mempermudah perbandingan antar kelompok. Dengan melakukan analisa seperti ini, peneliti dapat mengetahui topik mana yang baru sedikit mendapatkan perhatian, dan juga dapat menjadi pertimbangan dalam menentukan topik penelitian baru.
Keywords
Pemodelan topik, literatur ilmiah, penggalian teks, alokasi dirichlet laten, pemodelan topik struktural