SOC Press, Indonesia Symposium on Computing (IndoSC) 2016

Font Size: 
Klasifikasi Topik pada Lirik Lagu dengan Metode Multinomial Naive Bayes
Rifqi Abdul Aziz, Mohamad Syahrul Mubarok, Adiwijaya Adiwijaya


Full Text: PDF

Abstract


Saat ini sistem pengkategorian lagu pada aplikasi pemutar musik seperti iTunes pada iPhone sudah mampu mengkategorikan lagu berdasarkan genre, artist, dan album. Namun belum terdapat pengkategorian lagu berdasarkan topik lagu, sehingga untuk mengkategorikan lagu berdasar topik ini masih dilakukan secara manual. Penelitian ini bertujuan untuk membuat sistem yang mampu mengkategorikan lagu berdasarkan topik lagu dengan menggunakan lirik lagu sebagai objek penelitian. Penelitian ini diawali dengan mengumpulkan lirik lagu dari berbagai website penyedia lirik lagu sebagai dataset penelitian, kemudian dilakukan preprocessing data yang terdiri dari case folding, tokenization, stopword removal dan stemming. Tahap selanjutnya yaitu melakukan feature selection dengan menggunakan metode chi-square. Selanjutnya hasil feature selection tersebut dilakukan feature extraction dengan menggunakan metode bag of words. Selanjutnya dilakukan pembangunan classifier yang nantinya digunakan pada saat proses klasifikasi. Tahap selanjutnya yaitu melakukan klasifikasi lirik lagu pada data testing kedalam sebuah kelas topik tertentu dengan menggunakan metode multinomial naïve bayes. Tahap terakhir pada penelitian ini yaitu mengevaluasi sistem dengan menghitung accuracy, precission, recall, dan f1-measure. Kelas topik lagu yang dihasilkan pada sistem ini yaitu cinta, persahabatan, nasionalisme, keluarga, religi dan konten negatif. Performansi sistem yang dihasilkan pada penelitian ini didapatkan nilai f1-measure sebesar 88.91% dan nilai akurasi 96.00%.


Reference


[1] Y. RM and Siswandi, Pendidikan Seni Budaya, Bogor: yudhistira, 2008.

[2] Mahedero, J. P., MartÍnez, Á., Cano, P., Koppenberger, M., & Gouyon, F. (2005, November). Natural language processing of lyrics. In Proceedings of the 13th annual ACM international conference on Multimedia (pp. 475-478). ACM.

[3] Manning, C. D., Raghavan, P., & Schutze, H. (2008). Text classification and naive bayes. Introduction to information retrieval, 1, 6. Crossref

[4] Eriyanto, Teknik Sampling Analisis Opini Publik, Yogyakarta: Lkis , 2007.

[5] Chawla, N. V. (2005). Data mining for imbalanced datasets: An overview. In Data mining and knowledge discovery handbook (pp. 853-867). Springer US. Crossref

[6] Liu, A. Y. C. (2004). The effect of oversampling and undersampling on classifying imbalanced text datasets (Doctoral dissertation, The University of Texas at Austin).

[7] S. M. Ross, Introductory Statistics : Third Edition, Los Angeles: Elsevier, 2010.

[8] Said, D. A. (2007). Dimensionality reduction techniques for enhancing automatic text categorization (Doctoral dissertation, Faculty of Engineering at Cairo University in Partial Fulfillment of the Requirements for the Degree of MASTER OF SCIENCE in COMPUTER ENGINEERING FACULTY OF ENGINEERING, CAIRO UNIVERSITY GIZA).

[9] J. E. Nesbitt, CHI-SQUARE, Manchester: Manchester University Press, 1966.

Last modified: 2016-11-02