Please enable JavaScript.
Coggle requires JavaScript to display documents.
1.3 การเตรียมข้อมูล, 1.3 การเตรียมข้อมูล, การเตรียมข้อมูล (Data…
1.3 การเตรียมข้อมูล
-
-
- การทำความสะอาดข้อมูล (Data Cleaning) คือ กระบวนการตรวจสอบและการแก้ไข ข้อมูลที่ผิดปกติ ข้อมูลที่ไม่สมบูรณ์ ข้อมูลที่ไม่ถูกต้อง หรือข้อมูลที่ไม่สัมพันธ์กับข้อมูลอื่น ๆออกไปจากข้อมูลที่จัดเลือกมาจากขั้นตอนแรก เพื่อให้ได้ผลลัพธ์เป็นข้อมูลที่เหมาะสมในการนำไปวิเคราะห์ และประมวลผลต่อ
-
-
-
-
- การคัดเลือกช้อมูล (Data Seloction) คือ การเลือกเฉพาะข้อมูลที่เกี่ยวข้องกับวัตถุประสงค์
-
-
-
-
-
Parsing
คือ การแจกแจงข้อมูล หรือการกำหนดส่วนหัวของข้อมูล (Header) เช่นเนื่องจากข้อมูลที่เก็บรวบรวมมาได้ มาจาก 2 แหล่งข้อมูล ทำให้ส่วนหัวของ ข้อมูลไม่ตรงกัน จึงจำเป็นต้องกำหนดส่วนหัวของข้อมูลใหม่ เพื่อให้ข้อมูลจาก ทั้ง 2 แหล่งนี้สอดคล้องกัน โดยสามารถกำหนดส่วนหัวของข้อมูลได้ ดังนี้
Correcting
คือ การแก้ไขข้อมูลที่ผิดพลาดหรือผิดปกติ เช่น ข้อมูล CAge มีข้อมูล 230 ซึ่งเป็นข้อมูลอายุที่ไม่ถูกต้อง และ ข้อมูล CCender บางรายการไม่มีการระบุข้อมูล
-
-
-
-
-
-
อาจต้องใช้เครื่องมือเพื่อช่วยระบุชุดข้อมูลที่มีซ้ำซ้อน โดยจากข้อมูลตัวอย่างมีข้อมูล ที่มีความซ้ำซ้อนกันอยู่ จำเป็นต้องลบข้อมูลที่ซ้ำช้อนออกจากรายการข้อมูลเพื่อให้ข้อมูลเหมาะสมสำหรับการประมวลผ