`

Data Science Adalah Bidang Ilmu Populer, Mengapa?

Data Science adalah bidang ilmu yang tengah populer seiring dengan perkembangan teknologi dan peningkatan volume data secara masif. Riset menemukan bahwa 95% bisnis masih memiliki masalah terkait data. Oleh karena itu, Data Science adalah salah satu disiplin ilmu yang dapat diterapkan di berbagai industri dan memiliki tingkat kebutuhan tinggi.

Apabila kamu tertarik mempelajari apa itu Data Science, berikut ini serba-serbi Data Science yang perlu kamu ketahui lebih lanjut.

Apa itu data science?

Secara teoretis, disadur dari Data Robot, data science adalah bidang ilmu yang menggabungkan kecakapan di bidang ilmu tertentu, keahlian pemrograman, serta penguasaan matematika dan statistik untuk menarik wawasan (insight) dari data. 

Pada praktiknya, data science adalah ilmu yang memasukkan logika matematika dan metode statistika ke dalam bahasa pemrograman. Tujuan utama penerapan data science adalah menguak wawasan (insight), informasi, pengetahuan, dan lainnya.

Namun, seorang data scientist bernama Jonathan Ma yang dikenal dengan persona Joma Tech, menyebut bahwa data science adalah ilmu yang memanfaatkan data dengan tujuan menyelesaikan suatu masalah. Menurut pria yang pernah bekerja di sejumlah perusahaan teknologi di AS itu, ada kekeliruan bahwa data science hanya berfokus pada machine learning dan programming. Padahal, kata dia, titik berat Data Science justru terletak pada seberapa besar dampak yang dapat dihasilkan pada bidang atau bisnis tertentu. 

Kemunculan data science

Priestley & Mcgrath (2019) dalam makalahnya yang berjudul The Evolution of Data Science: A New Mode of Knowledge Production merangkum, data science adalah penyatuan ilmu statistika dan ilmu komputer. Kedua bidang ilmu ini berkembang dengan memanfaatkan perkembangan penggunaan internet yang menghasilkan Big Data. 

Seiring perkembangan internet pada tahun 90-an, pakar statistika dan ilmu komputer menyadari penggunaan internet telah melahirkan arus dan volume data yang begitu banyak, sehingga diberi nama Big Data. Pakar melihat bahwa data yang dihasilkan dari penggunaan internet dapat dimanfaatkan lebih jauh. Terlebih, volumenya terus bertambah, sehingga terdapat kemungkinan penemuan wawasan baru dari data ini.

Sayangnya, ilmu statistika tradisional tidak memiliki kemampuan untuk menyimpan dan memproses Big Data. Kemudian komputer dipandang menjadi solusi karena mempunyai kemampuan automatisasi dan penyimpanan lebih baik. Kemampuan ini membantu data scientist memproses data dengan lebih cepat dan tepat.

Seiring perkembangan abad 21, pertumbuhan pengguna internet menciptakan permintaan di berbagai lini atas pengelolaan data. Hingga tahun 2019, diperkirakan setidaknya terdapat 50 zettabyte data tersebar di internet. Dengan demikian, data science adalah bidang ilmu yang akan terus popular dan berkembang.

Komponen Esensial bagi Data Science

Terdapat tiga komponen esensial dari Data Science. Komponen esensial pertama dari data science adalah statistika. Untuk mentransformasi data, seorang Data Scientist membutuhkan ilmu statistika yang membantunya membedah data dan memetakan pola di dalamnya. Pengetahuan ini penting untuk memahami perspektif atau paradigma yang digunakan di data science.

Komponen kedua dari data science adalah pemrograman. Untuk mengolah data dalam volume sangat banyak, seorang Data Scientist membutuhkan program yang dapat membantu proses pengolahan data. Program tertentu dapat membantu Data Scientist mengekstraksi, memilah data, dan menganalisis data. Dengan pendekatan terprogram, penghitungan secara manual tidak lagi dibutuhkan, dan dari sini muncul istilah automasi. Automasi ini memudahkan Data Scientist melimpahkan pengerjaan proses repetitif yang mudah dilakukan kepada komputer.

Komponen ketiga dari data science adalah visualisasi. Visualisasi data di data science bertujuan untuk mengomunikasikan hasil analisis yang ditemukan. Visualisasi data juga bertujuan untuk menyajikan informasi sehingga informasi lebih mudah dipahami, tidak bias, dan ditransfer menjadi pengetahuan. Grafik akan memberikan gambaran visual secara singkat dan komunikatif.

Data science adalah, pada intinya, mengubah data menjadi informasi. Data, begitu saja, tidak cukup bermanfaat. Ia butuh ditransformasikan dari ketidakjelasan menjadi informasi yang berguna” – Max, Pengajar Data Science di codingwithmax

Tahapan apa yang dilakukan dalam Data Science?

Berkeley School of Information menjelaskan, terdapat lima tahapan yang perlu dilalui di Data Science, yaitu capture, maintain, process, analyze, dan communicate.

Capture

Ia merupakan tahapan yang berhubungan dengan pemerolehan data (data acquisition), data entry (entri data), signal reception (resepsi sinyal), dan data extraction (ekstraksi data). Pada tahapan ini Data Scientist berusaha menggali data lebih jauh dengan berbagai teknik yang mampu digunakan dari berbagai sumber.

Maintain

Di tahapan ini Data Scientist dituntut mengelola dan mengorganisasikan data, yang meliputi data warehousing, data cleansing, data staging, data processing, dan data architecture.

Process

Data Scientist memproses data sesuai kebutuhan hingga mencapai gambaran umum yang diharapkan. Proses ini mencakup data mining, clustering/classification, data modeling, dan data summarization.

Analyze

Tahap ini mencakup exploratory/confirmatory, predictive analysis, regression, text mining, dan qualitative analysis. Pada tahap ini data dianalisis untuk menunjukkan hubungan yang mungkin terjadi antar komponen data. Hasil analisis juga menunjukkan dinamika data sesuai dengan kebutuhan dan fokus masalah.

Communication

Sebagai tahap terakhir, communication mencakup data reporting, data visualization, business intelligence, dan decision making. Tahap ini menyajikan hasil analisis data kepada user untuk penentuan keputusan.

Kesimpulan

Data Science adalah bidang ilmu yang lahir dari perkembangan teknologi dan merupakan sebuah respons dari kehadiran Big Data yang menarik untuk ditelaah. Lahirnya Data Science merupakan medium bagi pakar untuk menemukan wawasan baru dari big data.Dengan teknik apa pun yang digunakan, Data Science adalah bidang ilmu yang fleksibel dengan tools yang digunakan. Pada akhirnya Data Science bermuara pada satu tujuan, yaitu menyelesaikan masalah dengan data.

 

Penulis: Muhammad Ihsan

Editor: M. Wahyu Hidayat, Cahya Amalinadhi