Saya membuat tulisan ini berawal dari rasa penasaran saya terhadap data, awalnya saya belum mengerti guna dari data itu untuk apa dan mengapa data itu harus dikumpulkan secara regular lalu dibuat trendnya?
karena pekerjaan saya sangat berhubungan dengan data akhirnya saya mulai mengetahui fungsi dari data tersebut. Ok langsung saja kita analogikan secara sederhana
"Jika anda adalah seorang penjual minuman softdrink (dingin) dan anda ingin menaikan omzet, anda memiliki laporan harian penjulan dibulan November, dari datanya terdapat hari, item terjual dan suhu ketika anda berjualan"
Mari kita analisa bersama, kita akan mencari tau apakah cuaca berpengaruh terhadap penjualan softdrink?
kita akan cari korelasinya
dari hasil tes korelasi (angka yg dihighlight) bahwa cuaca sangat berpengaruh terhadap penjualan softdrink dengan angka 90.94% (hasil tersebut makin mendekati 100% maka semakin berhubungan), jadi kita dapat menambah omzet ketika cuaca sedang panas. Untuk case diatas saya sudahi sampai correlation dahulu.
sebenarnya langkah kedua kita harus masuk ke regresi, sebelum masuk kesana saya ingin menjelaskan dahulu apa perbedaan data scientist dan data analyst, seberapa penting data analyst dalam bisnis?
Q : Apa pebedaan antara data scientist dan data analyst
A : Data analyst atau juga kadang disebut Business Data Analyst adalah
profesi yang mengamati data, mencari pola dari data tersebut yang
menunjukkan kondisi dari suatu perusahaan. Pada umumnya data analyst
menggunakan data yang dihasilkan dari aplikasi Business Intelligence
(BI). Data analyst memiliki kemampuan mendalam di bidang bisnis yang
digeluti oleh perusahaan tersebut. Dengan kemampuannya tersebut maka
pola dari data yang diterima oleh aplikasi seperti BI bisa di
visualisasikan. Pola-pola data ini pada umumnya bersifat umum yang
banyak dialami oleh perusahaan yang sejenis.
Data analyst sudah sering kita kenal jauh sebelum teknologi Big Data.
Semua aplikasi business intelligence, data mining dan data warehouse
membutuhkan data analyst untuk menterjemahkan data. Data tersebut perlu
di terjemahkan ke dalam kalimat yang dipahami oleh level top management.
Sehingga diketahui misalnya apakah penjualan naik / turun berapa persen
dan sebagainya tergantung dari jenis data yang dihasilkan.
Sekarang tentang Data Scientist sendiri itu apa? Data scientist
sesuai dengan namanaya adalah seorang scientist atau ilmuwan. Seperti
layaknya ilmuwan, data scientist melakukan experimen-experimen untuk
menemukan hal-hal baru yang nantinya bermanfaat untuk perusahaan.
hal-hal baru ini bisa jadi merupakan pola-pola yang tidak umum terjadi
atau tidak umum diketahui oleh perusahaan sejenis. Dengan menemukan
pola-pola baru inilah, perusahaan bisa mendapatkan keuntungan daripada
kompetitor mereka. Seringkali, kemenangan dalam persaingan bisnis
ditentukan oleh kemampuan data scientist yang menganalisa data tersebut.
Contoh pola yang dicari data scientist misalnya pola atau model
rekomendasi item yang biasa digunakan di web site e-commerce seperti
Amazon atau misalnya seperti di Netflix. Pola atau model rekomendasi ini
meskipun namanya sama tentunya berbeda dari satu perusahaan ke
perusahaan lainnya karena karakteristik konsumennya, jenis barang yang
ditawarkan dsb-nya. selain itu
Data scientist diperlukan untuk menganalisa data dalam jumlah banyak
yang terdapat dalam sistem Big Data. Seorang Data Scientist harus
memiliki kemampuan di tiga bidang. Pertama adalah kemampuan tentang
business logic di bidang yang digeluti oleh perusahaan yang sedang dia
tangani, seperti halnya data analyst. Kedua adalah kemampuan statistika
dan matematika yang cukup untuk mengetahui pola-pola data berikut dengan
algortimanya. Ketiga adalah kemampuan menggunakan tools dari sistem Big
Data yang membantunya dalam mengolah dan menganalisis data seperti
misalnya aplikasi Machine Learning Apache Mahout dan Apache Spark (source).
Banyak yang berpendapat bahwa "Data Scientist is The Sexiest Job of 21th Century", lalu bagaimana kita memulai untuk menjadi seorang data scientist?
"A data scientist is someone who is better at statistics than any software engineer and better at software engineering than any statistician" - Josh Wills
dan berikut step-step yg harus kita lalui :
Jadi kesimpulan menurut saya, data scientist sangatlah diperlukan didalam setiap bisnis yang bergerak baik jasa ataupun produk, karena data scientist itu dapat memberi insight yang baru dari situasi belum disadari ataupun telah disadari dan baik bersifat strategis ataupun informasi dari fenomena yang sedang terjadi dan akan terjadi.
sebagai informasi tambahan, top 10 company yang memiliki data scientist terbanyak (Based on Linkedin data)
Pada tulisan selanjutnya saya akan kupas lebih dalam tentang "Learning Data Science", jika ada masukan terkait dengan data scientist silahkan langsung comment dibawah
Terima kasih
Salam Hangat
Umar






