Please enable JavaScript.
Coggle requires JavaScript to display documents.
Fundamental Data Roles & Skills - Coggle Diagram
Fundamental Data Roles & Skills
Data Science vs Data Analysis vs Data Engineering
Data Science
Definisi (IBM)
Ilmu yang menggabungkan matematika, statistik, pemrograman khusus, analisis lanjutan, kecerdasan buatan, dan machine learning dengan bidang keahlian tertentu untuk mendapatkan insight dari data organisasi.
Istilahnya luas dan umum (tanpa definisi yang jelas), sehingga keahlian yang dibutuhkan cukup luas.
Tugas Utama
Menggunakan statistika dan machine learning untuk memprediksi dan menjawab key business question.
Mengembangkan pemodelan.
Mengintegrasikan data.
Menggunakan machine learning dan deep learning untuk analisis data.
Menjadi jembatan antara stakeholder dan customers.
Proses & Siklus
[🖼️ MASUKKAN FOTO: SIKLUS DATA SCIENCE DI SINI]
Studi Kasus: Toko E-Commerce
Tujuan: Meningkatkan penjualan dengan memahami pola pembelian pelanggan (identifikasi faktor yang mempengaruhi keputusan pembelian).
Hasil yang Diharapkan
Identifikasi produk atau kategori produk yang paling diminati oleh pelanggan.
Pemahaman lebih baik tentang profil pelanggan yang cenderung melakukan pembelian.
Rekomendasi strategi pemasaran yang lebih efektif untuk meningkatkan penjualan.
Data Engineering
Definisi
Disiplin dalam ilmu data yang berkaitan dengan pengumpulan, penyimpanan, dan pemrosesan data untuk memastikan data dapat digunakan dan diakses secara efisien dan efektif.
Peran & Tanggung Jawab
Membangun dan mengoptimasi sistem yang membantu data analyst untuk bekerja.
Memahami programming, mengembangkan, menguji, dan memelihara arsitektur data.
Mengembangkan machine learning dan pipeline untuk proses ETL.
Memastikan akurasi dan fleksibilitas data.
Mengelola aliran data serta merancang & mengimplementasikan sistem penyimpanan data.
Siklus & Tanggung Jawab
[🖼️ MASUKKAN FOTO: SIKLUS & TANGGUNG JAWAB DATA ENGINEER DI SINI]
Studi Kasus: Aplikasi Pengguna
Tujuan: Meningkatkan performa aplikasi dengan mengoptimalkan penyimpanan dan mengelola aliran data (profil & aktivitas pengguna).
Hasil yang Diharapkan
Peningkatan kinerja aplikasi dengan waktu respons yang lebih cepat.
Menyimpan data yang terstruktur dan terorganisir dengan baik.
Memiliki sistem yang dapat diandalkan dan mudah dikelola.
Data Analysis
Definisi
Suatu proses pengumpulan, pembersihan, transformasi, penyajian, pemodelan, dan interpretasi data sehingga kita dapat mengetahui pola serta informasi/wawasan yang bernilai di dalam data.
Tugas Utama
Membagikan "value" dengan mengambil data dan mengomunikasikannya pada stakeholder untuk membantu membuat keputusan bisnis.
Pemeliharaan data, pengumpulan, dan pemrosesan data.
Bertanggung jawab untuk analisis statistik dan interpretasi data.
Melakukan data visualisasi untuk membuat pelaporan.
Alur Kerja (Contoh Tren Penjualan 1 Tahun)
Pengumpulan: Mengumpulkan data terlebih dahulu.
Pengolahan: Membuat kolom baru dan membuat format tertentu.
Transformasi: Membuat rumus baru dan mengubah tipe data (Hasilnya masih raw data).
Penyajian: Membuat bagaimana data bisa bercerita (Ex: Tren penjualan naik saat mendekati hari besar seperti Lebaran).
Pemodelan: Dilakukan bila diperlukan (Ex: Prediksi pasar untuk peluncuran produk baru).
Pentingnya Data Analysis
Mencakup proses data collection, data cleaning & transformation, data visualization, dan data modelling.
Menjadi dasar pengumpulan informasi dan validasi bahwa informasi ini benar-benar penting.
Informasi yang sudah divalidasi akan menjadi dasar pengambilan keputusan.
4 Jenis Data Analysis (Efek Domino - Saling Berkesinambungan)
Analisis Deskriptif: Melihat karakteristik dan pola data (Apa yang terjadi?).
Contoh: Data peningkatan frekuensi masyarakat berjualan online pas pandemi.
Analisis Diagnostik: Mengidentifikasi penyebab yang memengaruhi masalah/kejadian (Apa penyebab terjadinya?).
Contoh: Manajer mengidentifikasi penyebab kinerja karyawan buruk, solusi efisiensi, & kepuasan pelanggan.
Analisis Prediktif: Memprediksi kejadian/hasil di masa depan berdasarkan data historis/saat ini (Apa yang akan terjadi nanti?).
Contoh: Membantu manajer identifikasi peluang pasar baru, optimasi strategi marketing, & perkiraan demand.
Analisis Preskriptif: Merekomendasikan/menyarankan tindakan yang harus diambil untuk mencapai tujuan (Apa yang harus dilakukan agar prediksi terjadi?).
Contoh: Di bidang kesehatan, membantu dokter menentukan pengobatan paling efektif.
Proses Analisis
[🖼️ MASUKKAN FOTO: PROSES DATA ANALISIS DI SINI]
Studi Kasus: Toko Ritel Kecil
Tujuan: Meningkatkan efisiensi stok untuk mengurangi kehilangan dan meningkatkan keuntungan.
Hasil yang Diharapkan
Mengurangi angka kehilangan stok dan peningkatan keuntungan dengan manajemen stok yang lebih efisien.
Memiliki pemahaman lebih baik tentang tren penjualan dan preferensi pelanggan.
Optimalisasi inventaris untuk memenuhi permintaan pelanggan.
Data Analysis in Business
Manfaat dalam Bisnis
Mengoptimalkan keputusan bisnis.
Meningkatkan efisiensi operasional.
Meningkatkan kepuasan pelanggan.
Meningkatkan inovasi produk dan layanan.
Tantangan 4V di Era Digital
Volume (Jumlah)
Mengacu pada jumlah besar data yang dihasilkan & dikumpulkan setiap hari.
Tantangan: Membutuhkan penyimpanan (storage) dan pemrosesan data yang sangat besar secara efektif & efisien.
Variety (Keberagaman)
Mengacu pada keragaman jenis data yang dikumpulkan.
Jenis Data: Struktural (teks singkat, tanggal, angka) & Nonstruktural (gambar, audio, video, teks panjang).
Tantangan: Bagaimana cara mengintegrasikan dan mengelola data dari sumber yang berbeda.
Velocity (Kecepatan)
Mengacu pada kecepatan data yang dihasilkan & dikumpulkan setiap hari.
Tantangan: Dibutuhkan kecepatan & keefektifan memproses data sehingga dapat digunakan sesuai waktunya (real-time).
Veracity (Keakuratan)
Mengacu pada keakuratan dan keandalan data (bisa saja tidak akurat, tidak lengkap, atau salah).
Tantangan: Memastikan data yang diperoleh akurat & mampu mengidentifikasi data yang tidak akurat/tidak relevan.
How to Upskill, Learn, & Build Portfolio
Skill & Tools Seorang Data Analis
Softskill: Kemampuan analisis, pemecahan masalah, komunikasi, dan domain knowledge.
Matematika & Statistika: Dasar fundamental & statistika klasik (regresi). Penting untuk hal advance seperti decision tree & neural network.
Programming (Python / R)
Kegunaan: Membantu pengerjaan dataset besar & memudahkan pengolahan data/membuat model ML.
Cara Belajar: Install di device pribadi atau gunakan Google Colab (tanpa instalasi) & belajar pakai kaggle dataset.
SQL (Structured Query Language)
Kegunaan: Bahasa untuk berinteraksi dengan RDBMS & mendapatkan data dalam database untuk kerja sehari-hari.
Cara Belajar: Ikuti bootcamp atau self-taught memanfaatkan BigQuery Public Dataset.
BI Tools
Kegunaan: Software untuk pengumpulan, analisis, & penyajian data bentuk visualisasi (untuk project dashboard).
Cara Belajar: Install PowerBI, Tableau Public, MicroStrategy, atau gunakan alternatif tanpa install yaitu Looker Studio.
How to Build a Portfolio
Definisi Portfolio Data
Kumpulan projek berkaitan dengan pengolahan data, pembuatan model, atau BI Dashboard (Contoh: Analisis Churn Customer Perbankan).
Pentingnya Portofolio
Memberikan demonstrasi kemampuan & kecakapan saat apply pekerjaan.
Mempersiapkan diri untuk berhadapan dengan real-world data.
Bagaimana & Di Mana Membuatnya?
Mulai dengan memilih proyek yang relevan dengan industri yang dituju.
Cari dataset di public dataset (UCI Machine Learning Public Dataset atau Kaggle).
Publikasikan di platform seperti GitHub, Kaggle, atau personal website.
Memanfaatkan Portfolio dalam Rekrutmen
Tautkan link publikasi proyek dalam resume atau LinkedIn, sampaikan saat wawancara.
Sesuaikan portfolio dengan job description lowongan pekerjaan & interview.
Berikan highlights pada dampak (impact) dari proyek tersebut.
Dapatkan feedback dari interviewer untuk menunjukkan keinginan terus berkembang.