SOC Press, Indonesia Symposium on Computing (IndoSC) 2016

Font Size: 
Automatic Crawling Data in Twitter
Jaka Eka Sembodo


Full Text: PDF

Abstract


Twitter merupakan salah satu jejaring sosial yang pertama kali diluncurkan pada Juli 2006 dan saat ini banyak digunakan oleh masyarakat seluruh dunia. .Twitter mempunyai fungsi sebagai media sosial bertipe micro-blogging (blog berukuran kecil) dengan jumlah karakter dalam tweet (post dalam twitter) maksimal 140 karakter. Permasalah saat ini adalah sulit untuk mengambil data (crawling data) dari twitter baik berupa user maupun tweet secara otomatis. Sehingga dalambeberapa penlitian yang menggunakan data tweet menjadi kurang efisien dalam prosespengumpulan data. Pada penelitian ini penulis mengembangkan aplikasi dengan memodifikasi Application Programming Integration (API) twitter dengan menggunakan Bahasa pemograman PHP untuk membangun sistem crawling data di twitter secara otomatis. Crawling data di twitter dapat menggunakan dua sistem pencarian, by user dan by keyword. Pencarian menggunakan by keyword yaitu pencarian menggunakan penggalan kata maupunu hashtag dengan total tweet yang diunduh dalam sekali proses maksimum 100 tweet. Sedangkan pencarian dengan by user yaitu pencarian berdasarkan nama akun user twitter dengan total tweet yang diunduh dalam sekali proses maksimum 200 tweet. Ekstrasi fitur yang didapat dari index twitter untuk data user berupa total tweet, total follower, total following, total likes, website, source, bio profile, id, akun, nama dan lokasi. Sedangkan ekstraksi fitur yang didapat dari index twitter untuk data tweet berupa url, mention, retweet, hashtag, jumlah likes dan jumlah retweet.

Reference


[1] Lehmann, J., Castillo, C., Lalmas, M., & Zuckerman, E. (2013, May). Finding news curators in twitter. In Proceedings of the 22nd International Conference on World Wide Web (pp. 863-870). ACM. Crossref

[2] Lehmann, J., Castillo, C., Lalmas, M., & Zuckerman, E. (2013, July). Transient News Crowds in Social Media. In ICWSM.

[3] Kwak, H., Lee, C., Park, H., & Moon, S. (2010, April). What is Twitter, a social network or a news media?. In Proceedings of the 19th international conference on World wide web (pp. 591-600). ACM.

[4] Valkanas, G., Saravanou, A., & Gunopulos, D. (2014, October). A faceted crawler for the twitter service. In International Conference on Web Information Systems Engineering (pp. 178-188). Springer International Publishing. Crossref

[5] Diakopoulos, N., De Choudhury, M., & Naaman, M. (2012, May). Finding and assessing social media information sources in the context of journalism. In Proceedings of the SIGCHI Conference on Human Factors in Computing Systems (pp. 2451-2460). ACM.

[6] W. Jason Gilmore, “Beginning PHP and MySQL”, Apress, 2010. ISBN 978-1-4302-3114-1. Crossref

Last modified: 2016-11-02