Sistem Pencarian Lintas Ayat Al-Qur'an Berdasarkan Kesamaan Fonetis
Abstract
Mencari teks Arab dalam Al-Qur'an tidak mudah bagi pengguna yang tidak memiliki cukup pengetahuan tentang bahasa dan tulisan Arab. Banyaknya ayat dan perbedaan bahasa dalam Al-Qur'an menimbulkan kesulitan tersendiri untuk pencarian ayat oleh masyarakat muslim Indonesia. Dibutuhkan sistem pencarian ayat Al-Qur'an berbasis fonetis yang dapat memudahkan pengguna dalam mencari ayat menggunakan tulisan latin berhuruf alfabet yang merepresentasikan bunyi pengucapan pengguna. Sebagai contoh, jika dilakukan pencarian kata الْØَمْد٠لÙلَّـهÙ maka sistem akan menampilkan seluruh ayat yang memiliki kemiripan bunyi dengan kata kunci. Untuk saat ini, sudah ada sistem pencarian ayat Al-Qur'an dengan menggunakan phonetic string matching, namun terbatas hanya dapat menemukan ayat berdasarkan query yang tidak lintas ayat. Kemudian jika dilakukan pencarian kata lintas ayat يَوْم٠الدÙّين٠(4) Ø¥Ùيَّاكَ
dengan pencocokan string dalam database, maka sistem tidak dapat memberikan hasil pencarian dua ayat sekaligus. Oleh karena itu, dibangun suatu sistem pencarian ayat Al-Qur'an berdasarkan kemiripan bunyi (fonetis) yang dapat melintasi ayat. Algoritma N-gram berupa trigram digunakan untuk menemukan ayat-ayat yang memiliki kemiripan bunyi (fonetis) karena memiliki MAP yang tinggi untuk kata kunci panjang. Untuk mencari lintas ayat, lima buah trigram ayat selanjutnya ditambahkan ke ujung trigram ayat sebelumnya. Kemudian diperoleh nilai MAP 0,9 dan Recall 0,93.
Downloads
References
Istiadi MA. Sistem Pencarian Ayat Al-Quran Berbasis Kemiripan Fonetis. Final Project IPB. Bogor; 2012.
Syaroni M, Munir R. Pencocokan String Berdasarkan Kemiripan Ucapan (Phonetic String Matching) dalam Bahasa Inggris.In: Seminar Nasional Aplikasi Teknologi Informasi (SNATI); 2005.
Cavnar WB, Trenkle JM, et al. N-gram-based text categorization. In: Proceedings of SDAIR-94, 3rd annual symposium ondocument analysis and information retrieval. vol. 161175; 1994.
Hamzah A. Deteksi Bahasa untuk dokumen teks berbahasa indonesia. In: Seminar Nasional Informatika (SEMNASIF). vol. 1;2015.
Hsu W, Du M. Computing a longest common subsequence for a set of strings. BIT Numerical Mathematics. 1984;24(1):45–59.
Cohen W, Ravikumar P, Fienberg S. A comparison of string metrics for matching names and records. In: Kdd workshop ondata cleaning and object consolidation. vol. 3; 2003. p. 73–78.
Rochmawati Y, Kusumaningrum R. Studi Perbandingan Algoritma Pencarian String dalam Metode Approximate StringMatching untuk Identifikasi Kesalahan Pengetikan Teks. Jurnal Buana Informatika. 2016;7(2).
Gueddah H, Yousfi A, Belkasmi M. The filtered combination of the weighted edit distance and the Jaro-Winkler distance toimprove spellchecking Arabic texts. In: Computer Systems and Applications (AICCSA), 2015 IEEE/ACS 12th InternationalConference of. IEEE; 2015. p. 1–6.
Manning C, Raghavan P, Schütze H. Introduction to information retrieval. Natural Language Engineering. 2008;16(1):100–103.
Han S, He D, Yue Z, Jiang J. Contextual support for collaborative information retrieval. In: Proceedings of the 2016 ACMon Conference on Human Information Interaction and Retrieval. ACM; 2016. p. 33–42.
Copyright (c) 2019 Eki Rifaldi, Moch Arif Bijaksana, Kemas Muslim Lhaksamana
This work is licensed under a Creative Commons Attribution 4.0 International License.
- Manuscript submitted to IndoJC has to be an original work of the author(s), contains no element of plagiarism, and has never been published or is not being considered for publication in other journals.Â
- Copyright on any article is retained by the author(s). Regarding copyright transfers please see below.
- Authors grant IndoJC a license to publish the article and identify itself as the original publisher.
- Authors grant IndoJC commercial rights to produce hardcopy volumes of the journal for sale to libraries and individuals.
- Authors grant any third party the right to use the article freely as long as its original authors and citation details are identified.
- The article and any associated published material is distributed under the Creative Commons Attribution 4.0License