Ketika kita melihat tipe dan bentuk data yang ada sekarang ini, sangat mudah untuk menyaksikan bagaimana orang-orang menjadi heran dan dibuat kagum oleh Big Data beserta segala kemewahannya. Bagaimana mungkin data-data seperti itu bisa diolah menjadi informasi yang begitu dahsyat. Meskipun demikian, akibat progress kemajuan dunia IT yang begitu cepat, apa yang kita sebut “Big Data” sekarang ini, barangkali hanya akan menjadi “data” biasa keesokan hari.
Sebagai permulaan, apa yang tampak tidak biasa dan sangat menarik untuk sekarang ini, akan menjadi biasa saja di hari kemudian. Istilah Big Data yang begitu sederhana dan mudah untuk diingat. Sayangnya istilah ini terlalu menekankan pada Volume data saja. Padahal, Volume hanya salah satu dari beberapa “V” yang lain, sebagai basic dari Big Data.
Secara umum, Big Data terdiri dari 3 unsur V, yaitu Volume, Velocity dan Variety. Namun belakangan ini para peneliti memberikan V tambahan, ada Veracity dan Value, sehingga menjadi 5V. Berikut ini adalah penjelasannya:
- Volume – berhubungan dengan jumlah dan ukuran data yang dihasilkan setiap detiknya.
- Velocity – berhubungan dengan kecepatan data yang dihasilkan dan bergerak hingga ke seluruh dunia. Sebagai contoh: pendeteksian fraud pada kartu kredit guna melacak jutaan transaksi dengan pola yang tidak biasa atau mencurigakan dan dalam waktu yang real time.
- Variety — berhubungan dengan tipe data yang berbeda-beda dan terus tumbuh, seperti: bermula dari data finansial kemudian berkembang hingga melibatkan data media social. Dari data foto, berkembang hingga data dari sensor.
- Veracity – Berhubungan dengan kekacauan atau ketidak teraturan data yang dihasilkan. Contohnya seperti data postingan twitter dengan hashtag, singkatan, typo, Bahasa daerah, hingga penggunaan Bahasa gaul yang tidak semua orang mengerti.
- Value – Ketika berbicara tentang value, tentu ini berhubungan dengan “nilai” atau seberapa besar manfaat data yang diekstrak. Memiliki data yang menggunung dan tak berujung memang penting. Namun, selama data tersebut tidak dapat diolah menjadi informasi yang bernilai, maka itu semua menjadi useless. Terkadang, meskipun tampak ada hubungan yang jelas antara data dan informasi yang akan dihasilkan, belum tentu data tersebut secara otomatis memiliki value untuk Big Data. Yang terpenting dalam menjalankan Big Data adalah, bahwa kita harus memahami terlebih dahulu tentang biaya dan manfaat yang dapat diperoleh dari mengumpulkan dan menganalisa data tersebut. Pastikan bahwa data tersebut nantinya bisa menghasilkan nilai yang besar untuk bisnis kita.
Tidak berhenti sampai di 5V, bahkan ada beberapa pakar yang melanjutkannya hingga 10V, seperti yang ditulis oleh George Firican, peneliti dari University of British Columbia, di tdwi.org. Ia menyebutkan adanya 10V sebagai karakteristik dan properties dari Big Data, yaitu: Volume, Velocity, Variety, Variability, Veracity, Validity, Vulnerability, Volatility, Visualization, dan Value. Tidak sampai di situ, peneliti dari Elder Research bahkan tidak tanggung-tanggung dalam memetakan Big Data dengan konsep V-nya. Ia mampu mendefinisikan karakteristik Big Data dengan 42V pada tahun 2017. Barangkali sekarang sudah berkembang lagi setelah satu tahun berlalu.
Referensi dan Rekomendasi Bacaan:
- Dean, J. (2014). Big Data, Data Mining, and Machine Learning. New Jersey: Wiley.
- Hurwitz, J., Nugent, A., Halper, F., & Kaufman, M. (2013). Big Data for Dummies. New Jersey: Wiley.
- Marr, B. (2015). Big Data: Using Smart Big Data Analytics and Metrics to Make Better Decisions and Improve Performance. West Sussex: Wiley.
- Marr, B. (2016). Big Data in Practice: 45 Successful Companies Used Big Data Analytics to Deliver Extraordinary Results. West Sussex: Wiley.
- https://tdwi.org/articles/2017/02/08/10-vs-of-big-data.aspx
- https://www.elderresearch.com/blog/42-v-of-big-data
Semarang, 12 Feb. 2019
F.A.R.
*Artikel ini telah lebih dulu dipublikasikan di http://www.fauziadi.com.