การเตรียมข้อมูล

คืออะไร


การเตรียมข้อมูล คือ กระบวนการจัดการข้อมูลดิบเพื่อให้เหมาะกับการวิเคราะห์และประมวลผลเพิ่มเติม เปรียบเสมือนการ "ทำความสะอาด" และ "จัดระเบียบ" ข้อมูลให้พร้อมใช้งาน เปรียบเสมือนการเตรียมวัตถุดิบก่อนการปรุงอาหาร

ข้อมูลดิบมักอยู่ในรูปแบบที่หลากหลาย ไม่เป็นระเบียบ ไม่สมบูรณ์ และมีข้อผิดพลาด

การเตรียมข้อมูล ช่วยให้ข้อมูลมีความถูกต้อง ครบถ้วน สมบูรณ์ สม่ำเสมอ และอยู่ในรูปแบบที่เหมาะสม

ทำไมถึงสำคัญ

ข้อมูลดิบมักอยู่ในรูปแบบที่หลากหลาย ไม่เป็นระเบียบ ไม่สมบูรณ์ และมีข้อผิดพลาด

ขั้นตอน

การทำความสะอาดข้อมูล

ตรวจสอบและแก้ไขค่าที่ผิดพลาด

ลบข้อมูลที่ไม่จำเป็น

จัดการกับค่าที่หายไป

เปลี่ยนรูปแบบข้อมูลให้สม่ำเสมอ

การแปลงข้อมูล

แปลงข้อมูลให้อยู่ในรูปแบบที่เหมาะสมกับการวิเคราะห์

สร้างตัวแปรใหม่

รวมชุดข้อมูล

การตรวจสอบข้อมูล

ตรวจสอบความถูกต้อง ครบถ้วน สมบูรณ์ สม่ำเสมอ

วิเคราะห์ความสัมพันธ์ของข้อมูล

ตรวจสอบค่าผิดปกติ

เครื่องมือ

โปรแกรมตารางทำงาน เช่น Microsoft Excel, Google Sheets

โปรแกรมวิเคราะห์ข้อมูล เช่น R, Python

เครื่องมือเฉพาะทางสำหรับการเตรียมข้อมูล เช่น Alteryx, DataRobot

น.ส.จุฑาทิพย์ มนัส เลขที่17 ม.5/2