Data Scientist Vs Data Engineer Vs Data Analyst

Apa itu Data Science?

Istilah “Data Science” belakangan menjadi sangat hangat bersamaan dengan semakin populernya istilah “Big Data”. Bahkan kini sangat mudah sekali menjumpai suatu lowongan pekerjaan pada perusahaan (terutama perusahaan besar) yang menyebutkan kebutuhannya akan seorang Data Scientist. Tentu saja definisi Data Scientist mengacu pada orang yang memahami dan menguasai tentang Data Science.

Ada beberapa klaim tentang kapan istilah “Data Science” untuk pertama kali diperkenalkan dalam forum resmi. Salah satu klaim yang paling popular adalah klaim yang menyebutkan bahwa istilah tersebut pertama kali dimunculkan pada 2008, oleh DJ Patil, yang kini menjabat sebagai Chief Data Scientist ofUnited States Office of Science and Technology Policy.

1 dekade berlalu, istilah ini masih digunakan bahkan menjadi semakin sering diperbincangkan belakangan ini. Meskipun demikian, ada banyak sekali perdebatan di antara para praktisi hingga akademisi mengenai apa sebenarnya pengertian dari “Data Science” tersebut. Sebagian menganggap bahwa Data Science adalah istilah lain dari Data Analytic yang selama ini sudah jamak digunakan oleh perusahaan-perusahaan besar. Sebagian lagi menganggap bahwa Data Science digunakan dalam konteks Big Data yang mana Machine Learning juga terlibat di dalamnya untuk penyelesaian suatu masalah.

Barangkali masing-masing perusahaan memiliki pengertian yang berbeda tentang apa itu Data Science. Sayangnya, hal ini menyebabkan terjadinya kebingungan khususnya untuk para pencari kerja, ketika mereka melamar pekerjaan sebagai Data Science. Istilah ini sebenarnya memiliki definisi yang sangat tergantung tentang peran apa yang musti dilakukan sekaligus tergantung juga dengan apa yang sedang dibutuhkan oleh perusahaan.

Pembagian Peran Dalam Data Science

Di dalam perusahaan besar, umumnya Data Science terdiri dari beberapa orang yang tergabung dalam 1 atau lebih tim. Tim Data Science bertanggung jawab dalam penggunaan Deep Learning untuk mengklasifikasikan gambar atau foto, seperti yang dilakukan tim Data Science-nya pada Yelp.

Berjuta-juta foto diupload oleh para pengguna Yelp setiap harinya. Sebagai akibat dari ledakan jumlah foto yang diunggah dengan konten yang beragam, akan menjadi sulit ketika kita mau mencari foto dari setiap restoran yang kita kehendaki. Terkadang, foto-foto yang diunggah merupakan foto-foto yang berada dalam satu kategori, seperti foto-foto tentang makanan atau foto bagian depan (wajah) restoran.

Sebetulnya kita dapat menggunakan Machine Learning untuk mengkategorikan foto-foto tersebut secara otomatis. Dengan bantuan Training Set, nantinya komputer akan dapat memberikan informasi kepada kita apakah suatu foto merupakan hasil jepretan makanan atau wajah restoran.

Pembagian Peran di Data Science

Dalam kasus tentang Yelp ini, suatu tim Data Scientist bertugas membuat model untuk membantu suatu komputer atau mesin agar dapat membedakan kedua jenis foto tersebut. Mereka harus mampu memikirkan secara menyeluruh tentang data yang mereka butuhkan untuk kasus tersebut, mulai dari secara menggunakan label (tag) pada foto hingga caption foto. Peran ini cenderung membutuhkan orang-orang yang memiliki jam terbang tinggi, sehingga masuk dalam kategori senior-level role. Mereka juga memiliki tanggung jawab pada hal-hal teknis, seperti pemilihan algoritma hingga engineering design.

Data Engineer bertugas membuat sistem yang mampu menarik atau mengumpulkan data foto sekaligus menyimpannya. Selanjutnya, para Data Engineer bertanggung jawab dalam mengimplementasikan algoritma yang telah dipilih oleh tim dari Data Scientist. Di sini, orang-orang yang sudah mahir dalam tataran teknis dalam pembuatan sistem hingga implementasi algoritma sangat dibutuhkan.

Sedangkan tugas dari Data Analyst adalah menganalisa dan menyajikan dampak perubahan (dalam hal ini pengembangan system) yang dilakukan terhadap bisnis. Apakah perubahan ini bisa membuat user semakin puas, atau justru membawa dampak negatif, baik untuk user maupun perusahaan? Berapa banyak traffic yang dihasilkan dengan sistem yang baru ini? Pertanyaan seperti itu merupakan contoh pertanyaan yang harus disampaikan oleh tim Data Analyst. Selanjutnya, mereka harus mendiskusikan temuan mereka dengan pimpinan dan tim lain guna melakukan evaluasi apakah sistemnya layak dilanjutkan atau tidak. Tim ini bisa diisi lebih banyak analis-analis muda khususnya yang memiliki latar belakang bisnis, komunikasi, ilmu komputer, matematika dan statistik (tentu dengan bimbingan dari analis senior) untuk menerapkan pemikiran mereka dalam tataran teknis.

Referensi dan Buku Rekomendasi:

  1. Principles of Data Science
  2. What is Data Science.
  3. Data Science for Dummies.
  4. Analyzing the Analyzers.
  5. Building Data Science Teams.
  6. Ultimate Guide to Data Science Interviews.
  7. Data Jujitsu.
  8. On Being a Data Skeptic.
  9. Data Driven.

Semarang, 18 Feb. 2019

F.A.R.

Artikel ini dipublikasikan terlebih dahulu di http://www.fauziadi.com

Leave a Reply

Your email address will not be published. Required fields are marked *