Klasifikasi Sentimen Ulasan Tempat Makan Berbahasa Indonesia dengan Lexicon dan Improved Naive Bayes

  • Agi Maulana Telkom University
  • Yuliant Sibaroni School of Computing, Telkom University
Abstract views: 410 , PDF downloads: 795
Soruce Code and Data downloads: 0

Abstract

Ulasan tempat makan pada situs daring seringkali memberikan skor yang tidak sesuai dengan makna pada ulasan. Ulasan dapat berskor rendah namun ulasan mengandung makna positif dan ulasan berskor tinggi dapat mengandung makna yang negatif. Berbagai upaya klasifikasi sentimen ulasan dengan menggunakan analisis sentimen telah dilakukan pada banyak penelitian. Namun analisis sentimen dengan hanya mengandalkan pendekatan supervised learning memberikan hasil salah satu kelas cenderung lebih sering muncul sehingga berakibat pada menurunnya kinerja pengklasifikasi. Dalam makalah ini, pendekatan Improved Naive Bayes yaitu Naive Bayes dengan  fitur unigram dan bigram  dipadukan dengan pendekatan menggunakan lexicon diusulkan untuk meningkatkan kinerja pengklasifikasi. Fitur diperoleh dengan mengekstrak pola POS TAG yang mengandung kata atau frasa yang mengekspresikan emosi yang relevan dengan ulasan tempat makan. Lexicon dibangun secara manual dengan mengumpulkan kata dan frasa unigram dan bigram yang menunjukan emosi yang relevan diungkapkan pada ulasan tempat makan. Pengklasifikasi dengan menggunakan Improved Naive Bayes menunjuakan kinerja yang lebih baik dibandingkan pengklasifikasi menggunakan Naive Bayes. Improved Naive Bayes memperoleh skor precision 80%, recall 77%, dan F1 76%. Sedangkan Naive Bayes memperoleh skor precision 68%, recall 60%, dan F1 56%.

Downloads

Download data is not yet available.

References

comScore, “Online Consumer-Generated Reviews Have Significant Impact on Offline Purchase Behavior,†Study Conduct. by comScore Kelsey Gr. Reveal. that 24 Percent Online Local Serv. Rev. Users Purch. Serv., 2007

L. Zhang and B. Liu, “Sentimen Analysis and Opinion Mining,†Encycl. Mach. Learn. Data Min., no. May, pp. 1–10, 2016.

K. Khalifa and N. Omar, “A hybrid method using lexicon-based approach and Naive Bayes classifier for Arabic opinion question answering,†J. Comput. Sci., vol. 10, no. 10, pp. 1961–1968, 2014.

R. Feldman, “Techniques and applications for sentimen analysis,†Commun. ACM, vol. 56, no. 4, p. 82, 2013.

P. Patil and P. Yalagi, “Sentimen Analysis Levels and Techniques: A Survey,†vol. 5, no. Xi, pp. 3030–3035, 2017.

B. R. Samal, A. K. Behera, and M. Panda, “Performance analysis of supervised machine learning techniques for sentimen analysis,†Proc. 2017 3rd IEEE Int. Conf. Sensing, Signal Process. Secur. ICSSS 2017, pp. 128–133, 2017.

H. Kang, S. J. Yoo, and D. Han, “Senti-lexicon and improved Naive Bayes algorithms for sentimen analysis of restaurant reviews,†Expert Syst. Appl., vol. 39, no. 5, pp. 6000–6010, 2012.

Y. M. Aye and S. S. Aung, “Senti-Lexicon and Analysis for Restaurant Reviews of Myanmar Text,†no. 5, pp. 380–385, 2018.

linggom, “GitHub - linggom/BigDataGroupProjects: Group 2 projects on WebBig Data Summer School UI.†2015.

masdevid, “GitHub - masdevid/ID-Stopwords: Stopwords collection of Bahasa Indonesia collected from many sources.†2016.

Published
2020-01-07
How to Cite
Maulana, A., & Sibaroni, Y. (2020). Klasifikasi Sentimen Ulasan Tempat Makan Berbahasa Indonesia dengan Lexicon dan Improved Naive Bayes. Indonesia Journal on Computing (Indo-JC), 4(3), 107-116. https://doi.org/10.34818/INDOJC.2019.4.3.369
Section
Computer Science