PEMETAAN KASUS KORUPSI BERDASARKAN INDEKS PERSEPSI KORUPSI INDONESIA

Pemerintah memegang peranan penting dalam pertumbuhan ekonomi bangsa. Meski demikian, masih banyak kemunculan aparat pemerintah menyalahgunakan jabatannya untuk melakukan tindak pidana korupsi. Korupsi juga merusak legitimasi pemerintah dan nilai-nilai demokrasi lainnya . Sebagai masalah nasional, korupsi harus ditangani tegas dan jelas dengan segala potensi keterlibatan yang ada di masyarakat khususnya pemerintah dan aparat penegak hukum. Selain itu, media juga dapat merangkum pemikiran dan gagasan publik. Oleh karena itu, penggunaan media sosial sebagai sumber data untuk menghitung Indeks Persepsi Korupsi sangatlah penting bisa jadi masalah bagaimana mengklasifikasikan artikel berita yang berbicara tentang kasus korupsi dan artikel berita yang tidak berbicara tentang kasus korupsi.

Penelitian ini menggunakan metode Algoritma yaitu adalah Naïve Bayes Classifier, algoritme paling akurat untuk mengklasifikasikan dokumen.

Ada tujuh situs berita Indonesia yang dipertimbangkan untuk pendataan. Situs beritanya adalah Tempo, Detik, Kompas, Merdeka, Liputan6, Tribun News & Sindo News. dan tiga teknik pengumpulan data yang gunakan yaitu, Web Crawling, Web Scraping & Penjadwalan Cron. Web Crawling adalah perangkat lunak yang menjalankan penjelajahan secara rekursif dari satu halaman ke halaman lain dengan mengikuti link di setiap halaman. Hasil Crawl akan disimpan di Database. Web Scraping adalah teknik perangkat lunak yang mengumpulkan dan mengekstrak informasi dari halaman web, web scarping digunakan untuk mendapatkan konten berita berdasarkan artikel berita, lalu mengindeks dan menyimpan konten ke dalam Database. Dan untuk Penjadwalan Cron adalah penjadwalan dasar UNIX dan Linux untuk menjalankan perintah atau Skrip Shell secara berkala, dalam penelitian ini penjadwalan cron digunakan untuk menjalankan web crawling dan web scraping secara berkala. Dengan menggunakan ketiga teknik tersebut berhasil ditemukan 39.665 artikel berita terkumpul.

Dari penelitian ini dihasilkan data mode korupsi berdasarkan file fenomena berita dari media online terkait korupsi, yang akan diproses lebih lanjut untuk disarikan lokasi yang dirujuk oleh artikel. Dengan demikian membentuk data jumlah artikel yang telah diklasifikasikan berdasarkan tempat kejadian, yang dapat membantu pemerintah pusat untuk melakukan tindakan tertentu pada tempat tertentu berdasarkan data hasil penambangan teks. Hal itu diharapkan dapat meredam berbagai kasus korupsi daerah di Indonesia.

Buku Bacaan

[1] Ghosh, R., & Siddique, M. (2014). Corruption, Good Governance and Economic Development:
Contemporary Analysis and Case Studies.

[2] Huang, J., Lu, J., & Ling, C. (2003). Comparing naive Bayes, decision trees, and SVM with AUC
and accuracy .

[3] Jang, S., & Woo, W. (2005). 5W1H: Unified User-Centric Context. Proceedings of the 7th
International Conference on Ubiquitous Computing.

[4] Malik, D. (2001). Dari Konstruksi ke Dekonstruksi: Refleksi atas Pemberitaan Televisi Kita.

[5] Melgar, N., Rossi, M., & Smith, T. W. (2010). The Perception of Corruption. International Journal of Public Opinion Research, 22(1), 120–131.

[6] Murphy, K. P. (2006). Naive Bayes Classifiers Generative Classifiers, 4701, 1–8.

[7] Olteanu, A., Peshterliev, S., Liu, X., & Aberer, K. (2013). Web Credibility: Features Explorationand Credibility Prediction. Lecture Notes in Computer Science (Including Subseries LectureNotes in Artificial Intelligence and Lecture Notes in Bioinformatics), 557–568.

[8] Persson, A., Rothstein, B., & Teorell, J. (2013). Why Anti Corruption Reforms Fail — Systemic
Corruption as a Collective Action Problem, Governance, 26(3), 449–471.

[9] Rahimi, R., & Shakeri, H. (2016). Reflection on Judicial System’s Corruption and Offering
Solutions to Promote its Safety. Journal of Politics and Law, 9(9), 187.

[10] Rohwer, A. (2009). Measuring Corruption: A Comparison between the Transparency
International’s Corruption Perception Index and the World Bank’s Worldwide Governance
Indicators. DICE, 42–52.

[11] Schrenk, M. (2007). Webbots, spiders, and screen scrapers.

[12] Tala, F. (2003). A study of stemming effects on information retrieval in Bahasa Indonesia

[13] Tated, R. R., & Ghonge, M. M. (2015). A survey on text mining – techniques and application.
International Journal of Research in Advent Technology,(1), 380–385.

[14] Uca, N., Ince, H., & Sumen, H. (2016). The Mediator Effect of Logistics Performance Index on the
Relation between Corruption Perception Index and Foreign Trade Volume. European Scientific
Journal, 12(25), 1857–7881.

[15] Yang, J. M., Cai, R., Wang, C., Huang, H., Zhang, L., & Ma, W. Y. (2009). Incorporating Site-
Level Knowledge for Incremental Crawling of Web Forums: A List-Wise Strategy. Proceedings ofthe ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 1375–
1383.

 

Prof.Dr. Ir Sasmoko, M.Pd