Analisis Pengaruh Kernel Support Vector Machine (SVM) pada Klasifikasi Data Microarray untuk Deteksi Kanker

Rima Diani

Abstract


Berdasarkan data dari Pusat Data dan Informasi Kementrian Kesehatan RI, di tahun 2012 sekitar 8,2 juta kasus kematian disebabkan oleh kanker. Perkembangan terakhir menunjukan bahwa teknologi DNA microarray mampu menangani masalah deteksi kanker sejak dini, namun kelemahan utama dari microarray adalah masalah curse of dimensionality.

Analysis of Variance (ANOVA) merupakan salah satu metode seleksi fitur yang dapat mengatasi kelemahan microarray. ANOVA dapat menemukan pasangan gen informatif yang dapat membantu dalam proses pengklasifikasian yang dilakukan oleh Support Vector Machine (SVM). Dalam SVM, kernel trick saat learning model sangat membantu dalam mengatasi masalah feature space. Pemilihan kernel berpengaruh terhadap akurasi yang dihasilkan. Melalui serangkaian proses seperti perhitungan korelasi, seleksi fitur dan pengklasifikasian menggunakan SVM, didapatkan akurasi dari empat dataset yang digunakan. Untuk dataset leukimia dan ovarian cancer, akurasi terbesar dihasilkan oleh kernel polynomial yaitu sebesar 100% dan 97,54%. Sedangkan untuk dataset lung cancer akurasi terbesar diperoleh dari kernel linear yaitu sebesar 100% dan untuk dataset colon tumor akurasi terbesar diperoleh dari kernel RBF sebesar 85,15%. Perbedaan kernel yang menghasilkan akurasi tertinggi pada setiap dataset sangat bergantung kepada karakteristik dataset kanker itu sendiri.

Full Text:

PDF

References


Kumar, Mukesh, Sandeep Singh, and Santanu Kumar Rath. "Classification of Microarray Data using Functional Link Neural Network." Procedia Computer Science 57 (2015): 727-737.

Vanitha, C. Devi Arockia, D. Devaraj, and M. Venkatesulu. "Gene Expression Data Classification Using Support Vector Machine and Mutual Information-based Gene Selection." Procedia Computer Science 47 (2015): 13-21.

Bharathi, A., and A. M. Natarajan. "Cancer Classification of Bioinformatics datausing ANOVA." International journal of computer theory and engineering 2.3 (2010): 369.

Siang, Tan Ching, et al. "A Review of Cancer Classification Software for Gene Expression Data." International Journal of Bio-Science and Bio-Technology7.4 (2015): 89-108.

Singh, Rabindra Kumar, and M. Sivabalakrishnan. "Feature Selection of Gene Expression Data for Cancer Classification: A Review." Procedia Computer Science 50 (2015): 52-57.

Nugroho, Anto Satriyo, Arief Budi Witarto, and Dwi Handoko. "Support Vector Machine Teori dan Aplikasinya dalam Bioinformatika." Kuliah Umum Ilmu Komputer. com (2003).

Sembiring, Krisantus. "Penerapan teknik support vector machine untuk pendeteksian intrusi pada jaringan." Institut Teknologi Bandung (2007).

Santosa, Budi. "Tutorial Support Vector Machine." Teknik Industri, ITS.[Online]. Tersedia: http://www. google. co. id/url (2010).

Astris Dyah Perwita et. Al. 2013. Uji Kinerja Penggabungan Algoritma Support Vector Machine and Simulated Annealing pada Permasalahan Klasifikasi Pola. 2013. Jurnal Teknik Pomits Vol. 2, No. 1, (2013) ISSN: 2337-3539 (231-9271)

David M.W. Powers.What the F-Measure doesn’t measure. Technical Report KIT-14-001 Computer Science, Engineering & Mathematics, Flinders University (2014).

Pusat Data dan Informasi. 2015. Situasi Penyakit Kanker. Kementrian Kesehatan RI.

Pusat Data dan Informasi. 2015. Stop Kanker. Kementrian Kesehatan RI.

Roni Ridwan. 2008. Mengenak Alat Analisa Molekuler; DNA Sequencing, DNA Microarray, dan Real Time Polymerase Chain Reaction (RT-PCR). 2008. BioTrends Vol. 3, No.1 Tahun 2008.

General Overview of cDNA Microarray Process. http://brainarray.mbni.med.umich.edu/brainarray/resources/method.asp diakses tanggal 19 Oktober 2016

Expression Profilling with DNA Microarray Data Acquistion. http://www.slideshare.net/razavinader/dna-microarray-13455818 diakses tanggal 19 Oktober 2016

Sugiharto, Toto. "Analisis Varians." Bahan Kuliah Statistik II (2009).

Imam Chollissodin. Pengenalan Pola / Pattern Recognition.

R.Risky Dwi Listyo et. Al. 2012. Pengembangan Perangkat Lunak Prediktor Kanker Payudara menggunakan Metode Elastic SCAD SVM dan Data DNA Microarray. 2012. Jurnal Teknik ITS Vol. 1, (Sept,2012) ISSN: 2301-9271.

Jain, Yogendra Kumar, and Santosh Kumar Bhandare. "Min max normalization based data perturbation method for privacy protection." International Journal of Computer & Communication Technology (IJCCT) 2.8 (2011): 45-50.

Jinyan Li, Huiqing Liu. Kent Ridge Bio-medical Dataset. Didapat dari: http://datam.i2r.a-star.edu.sg/datasets/krbd/. Diakses tanggal 26 Oktober 2016.

Díaz-Uriarte, Ramón, and Sara Alvarez De Andres. "Gene selection and classification of microarray data using random forest." BMC bioinformatics7.1 (2006): 1.

Zhou, Qifeng, et al. "Gene selection using random forest and proximity differences criterion on DNA microarray data." Journal of Convergence Information Technology 5.6 (2010): 161-170.




DOI: http://dx.doi.org/10.21108/INDOJC.2017.2.1.169

Refbacks

  • There are currently no refbacks.


Copyright (c) 2017 Rima Diani

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.