Abstract
Emosi merupakan salah satu komponen penting bagi manusia dalam berkomunikasi dan berinteraksi. Untuk membangun sebuah sistem komputer yang tidak hanya dapat membantu manusia dalam melaksanakan rutinitasnya sehari-hari, tapi juga dapat mengerti intensi, serta menjadi teman berbicara maupun asisten pribadi manusia, maka kemampuan untuk mengenal emosi wajib dimiliki oleh sebuah sistem komputer. Walaupun sudah makin banyak penelitian di bidang pengenalan emosi, namun saat ini tidak banyak datasets ataupun corpus untuk orang Asia. Cara seseorang untuk menampilkan emosi tidaklah universal. Budaya serta tata cara seseorang dalam bermasyarakat dapat mempengaruhi bagaimana seseorang menampilkan emosi ke lawan bicaranya. Untuk mendapatkan performa pengenalan emosi yang baik, maka idealnya dibutuhkan dataset/corpus orang Asia untuk mengenal emosi orang Asia dengan lebih baik. Tentu, para peneliti akan membandingkan apakah sistem yang telah di training dengan corpus Asia memberikan akurasi yang lebih tinggi untuk mengenal orang Asia, dibandingkan dengan sistem yang telah di training dengan corpus orang non-Asia. Sampai saat ini, corpus/dataset untuk pengenalan emosi pada dialog dyadic dengan menggunakan fitur multimodal untuk orang Asia masih sangat jarang. Hal ini dikarenakan proses perekaman (pengambilan data) serta anotasi memakan waktu yang tidak sedikit. Penelitian ini juga akan berkontribusi kepada peningkatan akurasi pada algoritma pengenalan emosi melalui fitur multimodal dengan menggunakan deep learning. Terakhir, diharapkan penelitian ini akan memberikan insights mengenai perbandingan pengenalan emosi dengan multimodal dengan uni-modal, serta perbandingan akurasi sistem yang menggunakan corpus non-Asia dengan corpus Asia (yang peneliti bangun di awal tahun penelitian) dengan target orang Indonesia.
Keywords
Pengenalan emosi, Indonesian corpus, dialog dyadic, deep learning, multimodal, uni-modal