Implementasi Text Summarization pada Ulasan Aplikasi Mobile JKN Menggunakan TF-IDF dan Cosine Similarity

  • Valencia Ivena Lim STMIK PPKIA Tarakanita Rahmawati
  • Fitria Fitria STMIK PPKIA Tarakanita Rahmawati
  • M. Hafid STMIK PPKIA Tarakanita Rahmawati
Keywords: Cosine Similarity, Text Summarization, TF-IDF, MMR

Abstract

ABSTRACT

Mobile JKN is an application developed by Badan Penyelenggara Jaminan Sosial (BPJS) Kesehatan that was developed for easier access to national health services. As of November 2024, this application has been downloaded 50 million times on the Google Play Store, and about 720 thousand reviews have been given by users. The reviews provided by users who have downloaded the Mobile JKN app are very useful and important for potential users and developers. However, the huge volume of reviews is a challenge in reading them one by one and can cause information overload. Based on the occurring problems, the author will apply text summarization to summarize the reviews of the JKN Mobile application by implementing the Term Frequency-Inverse Document Frequency (TF-IDF) and Cosine Similarity methods. The author added the Maximum Marginal Relevance (MMR) method because the TF-IDF and Cosine Similarity methods cannot produce a summary. Summarization is done by taking the most relevant reviews from among a collection of other reviews. This research resulted with the average Accuracy value of 29.6%, Precision 55.6%, and Recall 39.8%, with the highest value of Accuracy 38.4%, Precision 79.2%, and Recall 42.7%.                                       

Keywords: Cosine Similarity, Text Summarization, TF-IDF, MMR

 

ABSTRAK

Aplikasi Mobile JKN merupakan aplikasi yang dikembangkan oleh Badan Penyelenggara Jaminan Sosial (BPJS) Kesehatan yang dikembangkan untuk kemudahan akses layanan kesehatan nasional. Per November 2024, aplikasi ini telah diunduh sekitar 50 juta kali di Google Play Store dan sekitar 720 ribu ulasan telah diberikan oleh para pengguna. Ulasan-ulasan yang diberikan oleh pengguna yang telah mengunduh aplikasi Mobile JKN sangat bermanfaat dan penting bagi calon pengguna dan pengembang. Akan tetapi, volume ulasan yang sangat besar menjadi tantangan dalam membacanya satu per satu dan dapat menimbulkan information overload. Berdasarkan permasalahan yang terjadi, maka penulis akan menerapkan text summarization untuk meringkas ulasan-ulasan aplikasi Mobile JKN dengan mengimplementasikan metode Term Frequency-Inverse Document Frequency (TF-IDF) dan Cosine Similarity. Penulis menambahkan metode Maximum Marginal Relevance (MMR) karena metode TF-IDF dan Cosine Similarity tidak dapat menghasilkan ringkasan. Peringkasan dilakukan dengan mengambil ulasan-ulasan yang paling relevan dari antara kumpulan ulasan lainnya. Penelitian ini menghasilkan nilai rata-rata Accuracy 29,6%, Precision 55,6%, dan Recall 39,8% dengan nilai tertinggi Accuracy 38,4%, Precision 79,2%, dan Recall 42,7%.

Kata Kunci: Cosine Similarity, Text Summarization, TF-IDF, MMR

Downloads

Download data is not yet available.

References

R. Kumalasari, “Opini: Fenomena Penghindaran Informasi pada Infodemik Covid-19 Melalui Media Sosial”, Jurnal Sistem Informasi, Teknologi Informasi, dan Edukasi Sistem Informasi, vol. 2, no. 2, pp. 112-118, 2021. doi: 10.25126/justsi.v2i2.54

M. S. Utomo, J. S. Wibowo, and E. N. Wahyudi, “Text Summarization pada Artikel Berita Menggunakan Vector Space Model dan Cosine Similarity”, Dinamika Informatika : Jurnal Ilmiah Teknologi Informasi, vol. 14, no. 1, pp. 11-24, 2022. doi: 10.35315/informatika.v14i1.9163

S. Chamira, “Implementasi Metode Text Mining Frequency-Invers Document Frequency (Tf-Idf) untuk Monitoring Diskusi Online”, Journal of Informatics, Electrical and Electronics Engineering, vol. 1, no. 3, pp. 97-102, 2022. doi: 10.47065/jieee.v1i3.353

A. Z. Z. Abidin and A. Sukmadinata, “Sistem Deteksi Kerusakan pada Sistem Operasi Menggunakan Metode TF-IDF dan Cosine Similarity”, Jurnal Ilmiah Informatika, vol. 8, no. 2, pp. 107–112, 2020. doi: 10.33884/jif.v8i02.1968

R. H. Singh, S. Maurya, T. Tripathi, T. Narula, and G. Srivastav, “Movie Recommendation System Using Cosine Similarity and KNN”, International Journal of Engineering and Advanced Technology (IJEAT), vol. 9, no. 5, pp. 556-559, 2020. doi: 10.35940/ijeat.E9666.069520

A. Kurniawan and M. I. Humaidy, “Penerapan Algoritma Maximum Marginal Relevance dalam Pe-ringkasan Teks secara Otomatis”, Bulletin of Data Science, vol. 1, no. 2, pp. 49-56, 2022.

Y. A. Kresna, I. Cholissodin, and I. Indriati, “Peringkasan Teks Meng-gunakan Metode Maximum Marginal Relevance terhadap Artikel Berita Terkait COVID-19”, Jurnal Peng-embangan Teknologi Informasi dan Ilmu Komputer, vol. 5, no. 9, pp. 3901-3907, 2021.

M. Ramezani, M. S. Shahryari, A. R. Feizi-Derakhshi, and M. R. Feizi-Derakhshi, “Unsupervised Broadcast News Summarization; a Comparative Study on Maximal Marginal Relevance (MMR) and Latent Semantic Analysis (LSA)”, 28th International Computer Conference, Computer Society of Iran (CSICC), pp. 1-7, 2023. doi: 10.1109/CSICC58665.2023.10105403.

D. Sari, D. Hirdanti, N. S. Nasution, and F. P. Gurning, “Syistematic Literatur Review: Analisis Manfaat Digital Mobile JKN dalam Pembiayaan Kesehatan”, ZAHRA: Journal of Health and Medical Research, vol. 4, no. 1, pp. 1-9, 2024.

A. Z. Z. Abidin and E. Nurjanah, “Sistem Peringkas Teks Otomatis Multi Dokumen Kliping Artikel Berita Gempa Menggunakan Metode TF-IDF”, Jurnal Teknologi Informasi dan Komunikasi, vol. 13, no. 1, pp. 52-69, 2020. doi: 10.47561/a.v13i1.166

M. A. Rosid, A. S. Fitrani, I. R. I. Astutik, N. I. Mulloh, and H. A. Gozali, “Improving Text Pre-processing for Student Complaint Document Classification Using Sastrawi”, IOP Conference Series: Materials Science and Engineering, vol. 871, no. 1, pp. 1-6, 2020. doi: 10.1088/1757-899X/874/1/012017

F. A. Larasati, D. E. Ratnawati, and B. T. Hanggara, “Analisis Sentimen Ulasan Aplikasi Dana dengan Metode Random Forest”, Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, vol. 6, no. 9, pp. 4305-4313, 2022.

Halimah, S. Agustian, and S. Ramadhani, “Peringkasan Teks Otomatis (Automated Text Summarization) pada Artikel Berbahasa Indonesia Menggunakan Algoritma Lexrank”, Jurnal Computer Science and Information Technology (CoSciTech), vol. 3, no. 3, pp. 371-381, 2022. doi: 10.37859/coscitech.v3i3.4300

Y. Findawati and M. A. Rosid, Buku Ajar Text Mining. Sidoarjo: UMSIDA PRESS, 2021

D. Septiani and I. Isabela, “Analisis Term Frequency Inverse Document Frequency (TF-IDF) dalam Temu Kembali Informasi pada Dokumen Teks”, Sistem dan Teknologi Informasi Indonesia (SINTESIA), vol. 1, no. 2, pp. 81-88, 2022.

A. Apriani, H. Zakiyudin, and K. Marzuki, “Penerapan Algoritma Cosine Similarity dan Pembobotan TF-IDF System Penerimaan Mahasiswa Baru pada Kampus Swasta”, Jurnal Bumigora Information Technology (BITe), vol. 3, no. 1, pp. 19-27, 2021. doi: 10.30812/bite.v3i1.1110

D. A. Louis, S. Rostianingsih, and L. W. Santoso, “Implementasi Text Summarization pada Review Aplikasi Super di Google Play Store Menggunakan Metode Maximum Marginal Relevance”, Jurnal Infra, vol. 10, no. 2, pp. 179-183, 2022.

V. S. Ginting, K. Kusrini, and E. Taufiq, “Implementasi Algoritma C4.5 untuk Memprediksi Keter-lambatan Pembayaran Sumbangan Pembangunan Pendidikan Sekolah Menggunakan Python”, Inspiration: Jurnal Teknologi Informasi dan Komunikasi, vol. 10, no. 1, pp. 36-44, 2020. doi: 10.35585/inspir.v10i1.2535

Published
2025-01-26
Section
Articles