Please enable JavaScript.
Coggle requires JavaScript to display documents.
Data quality assesment & data cleaning techniques - Coggle Diagram
Data quality assesment & data cleaning techniques
Penilaian kualitas data
proses evaluasi terhadap data untuk identifikasi masalah dan kekurangan
Teknik pembersihan data
Duplikasi
Validasi
Standarisasi
Formatting
Data transformation & normalization
min-max scaling
mengubah data menjadi rentang nilai tertentu, 0--->1
standardization
Mengubah data menjadi distribusi standar dengan rata-rata 0 & deviasi standar 1
Log transform
Mengubah data dgn skala besar menjadi distribusi lebih normal dengan algoritma
Data integration & data fussion
Integrasi data
dari berbeda menjadi utuh
Penggabungan data
yang redundan/saling melengkapi untuk data lengkap/akurat
Teknik & algoritma dalam integrasi & penggabungan data
Perbandingan
Korelasi
Pencocokan data
Handling missing data, outliers & Inconsistencies
Outlier Treatment
Mengidentifikasi dan menangani outlier dengan teknik seperti penghapusan, substitusi / transformasi data
Data Consistency check
Memeriksa kesesuaian data dgn aturan / kriteria tertentu dan menangani inskonsistensi jika ditemukan
Data Imputation
mengisi nilai yang hilang dengan nilai yang dapat diperkirakan berdasarkan metode statistik atau pemodelan