Please enable JavaScript.
Coggle requires JavaScript to display documents.
กระบวนการวิทยาการข้อมูล, ะพ่ี, ดพะัี่ - Coggle Diagram
กระบวนการวิทยาการข้อมูล
ขั้นตอนที่ 1
การตั้งค่าถาม
ทําไมต้องเพิ่มยอดขาย (Why)
จะเริ่มขายเมื่อไร (When)
จะขายที่ไหน (Where)
จะขายอะไร (What)
จะขายเท่าไร (How much)
จะขายให้ใคร (Whom)
จะขายอย่างไร (How to)
ขั้นตอนที่ 2 การเก็บรวบรวมข้อมูล (Get the data)
หลังจากที่ได้ข้อมูลต่าง ๆ มาแล้ว ขั้นตอนต่อไปคือการทําความสะอาดข้อมูล (Data cleansing) การ แปลงข้อมูล (Data transformation) และการเชื่อมโยงข้อมูล เพื่อเตรียมข้อมูลให้พร้อม สําหรับการวิเคราะห์ เนื่องจากข้อมูลเหล่านี้มาจากหลากหลายแหล่ง และอยู่ในหลากหลายรูปแบบ หรือ หลากหลายโครงสร้าง หากนําข้อมูลเหล่านี้มาผนวกรวมกันโดยไม่ผ่านการจัดเตรียมข้อมูล จะทําให้ไม่
เหมาะสมในการนําไปวิเคราะห์
ตัวอย่างการเก็บข้อมูล เพื่อนํามาตอบคําถาม “กลุ่มลูกค้าเป็นใคร หรือกลุ่มใด”
เก็บข้อมูลรายละเอียดลูกค้า เช่น เพศ อายุ ประเภทสินค้าที่นิยมสั่งซื้อ จากข้อมูลการขายที่มีการ
ขั้นตอนที่ 3 การสํารวจข้อมูล (Explore the data)
ขั้นตอนนี้จะเป็นการทดลองวาดแผนภาพ หรือกราฟของข้อมูลในรูปแบบต่าง ๆ เพื่อพิจารณา ภาพรวมของข้อมูล ระหว่างการสํารวจอาจจะพบข้อผิดพลาดหรือปัญหาอื่น ๆ จากการตั้งคําถาม หรือการเก็บ รวบรวมข้อมูล ซึ่งทําให้ต้องกลับไปดําเนินการแก้ไขให้ถูกต้อง เช่น พบว่าข้อมูลสูญหาย ข้อมูลผิดรูปแบบ ข้อมูลมีค่าผิดปกติ
ตัวอย่างข้อผิดพลาด ที่อาจเกิดขึ้นกับข้อมูลของลูกค้า จากคําถาม “กลุ่มลูกค้าเป็นใคร หรือกลุ่ม
เดือน/ปีเกิด
ความไม่ถูกต้องของข้อมูล เช่น ลูกค้าบางรายอาจระบุวัน/เดือน/ปีเกิดผิดประเภท โดยข้อมูลที่ ถูกต้องควรจะเป็นข้อมูลประเภทวันที่ แต่ลูกค้าอาจจะระบุเป็นตัวอักษร
ขั้นตอนที่ 4 การวิเคราะห์ข้อมูล (Analyze the data)
การวิเคราะห์ข้อมูล คือ กระบวนการวิเคราะห์ข้อมูลเพื่อค้นหารูปแบบที่เชื่อมโยงกันของข้อมูล ค้นหา จุดผิดปกติเพื่อทดสอบสมมติฐาน หรือเพื่อตรวจสอบสมมติฐานด้วยทฤษฎีทางสถิติและการใช้ภาพ หรือแผนผัง กราฟิกต่าง ๆ มาช่วยอธิบายการวิเคราะห์ข้อมูล โดยสมมติฐานเหล่านี้จะประกอบด้วยตัวแปรต่าง ๆ และการ วิเคราะห์ข้อมูลจะวิเคราะห์ทีละตัวแปรเพื่อให้ได้ผลลัพธ์ ซึ่งการวิเคราะห์ข้อมูลที่ดีนั้นผู้วิเคราะห์จําเป็นต้อง
เข้าใจข้อมูลที่มีอยู่อย่างลึกซึ้ง จึงจะทําให้ได้ผลลัพธ์ที่มีคุณภาพ
ขั้นตอนที่ 5 การสื่อสารและการทําผลลัพธ์ให้เป็นภาพ (Communicate and visualize the
ขั้นตอนนี้เป็นขั้นตอนการนําผลการวิเคราะห์ข้อมูลที่ได้จากขั้นตอนก่อนหน้านี้มานําเสนอในลักษณะที่ ง่ายในการทําความเข้าใจ และนําไปสู่การตัดสินใจต่าง ๆ จากข้อมูลที่ได้ทําการวิเคราะห์ อีกทั้งผู้ที่อ่านผลการ วิเคราะห์นั้นอาจไม่มีความชํานาญด้านวิทยาการข้อมูล ส่งผลให้อาจไม่เข้าใจในสิ่งที่นักวิทยาศาสตร์ข้อมูล ต้องการสื่อสาร โดยเทนนิคที่นิยมมีหลายเทคนิค เช่น กราฟ อินโฟกราฟิก