Proses Data Science sendiri bisa diartikan upaya untuk mendapatkan insight dari data yang berjumlah sangat masif. Data-data tersebut bisa berupa banyak hal, misalnya saja teks, angka, gambar, suara dan masih banyak lagi.
Terus darimana bentuk data-data di atas dikumpulkan? Banyak, contohnya saja software, aplikasi mobile, gadget, remote sensing, geolocation, sensor nirkabel dan lain sebagainya. Sebelum ditangani oleh Data Scientist, data-data di atas disiapkan terlebih dahulu oleh Data Engineer.
Setelah pengumpulan data, data warehouse modelling dan transformasi data siap, maka seorang Data Scientist akan mempelajari kumpulan data tersebut. Jika sudah, yang menjadi output adalah kesimpulan-kesimpulan dan atau algortima yang nantinya bisa dimanfaatkan oleh perusahaan yang bersangkutan.