Please enable JavaScript.
Coggle requires JavaScript to display documents.
กระบวนการวิทยาการข้อมูล (data science process) Data-Scientist-1 - Coggle…
กระบวนการวิทยาการข้อมูล
(data science process)
กระบวนการวิทยาการข้อมูล
กระบวนการวิทยาการข้อมูล
(Data Science Process)
ดําเนินการตามกระบวนการของวิทยาการข้อมูลที่ระบุขั้นตอนสําคัญต่าง ๆ ที่ประกอบด้วย การตั้งคําถาม การเก็บรวบรวมข้อมูล การสํารวจข้อมูล การวิเคราะห์ข้อมูล การสื่อสารและการทําผลลัพธ์ให้เป็นภาพ สู่ผู้ใช้กลุ่มเป้าหมาย
ขั้นตอนที่ 1
การตั้งค่าถาม
(ask an interesting question)
ขั้นตอนที่ 2
การเก็บรวบรวมข้อมูล (get the data)
ขั้นตอนที่ 3
การสารวจข้อมูล (explore the data)
ขั้นตอนที่ 4
การวิเคราะห์ข้อมูล (analyze the data)
ขั้นตอนที่ 5 การสื่อสารเเละการทำผลลัพธ์ให้เป็นภาพ
ขั้นตอนที่ 2 การเก็บรวบรวมข้อมูล (Get the data)
หาข้อมูลเพื่อนํามาตอบคําถามต่าง ๆ ที่ได้กำหนด ขั้นตอนที่ 1 ซึ่งการเก็บข้อมูลนี้จะต้องอาศัยกระบวนการเก็บข้อมูลที่เหมาะสมและมีคุณภาพเพียงพอ เพื่อให้ ได้ข้อมูลเชิงลึกที่จําเป็น ซึ่งจะนําไปสู่ขั้นตอนการสํารวจข้อมูล และการวิเคาระห์ข้อมูลต่อไป
บันทึกไว้
ขั้นตอนที่ 1 การตั้งคําถาม (Ask an interesting question)
6W2H
คือ
Why ทำไม
When เมื่อไหร่
Where ที่ไหน
Whom ให้ใคร
What อะไร
Who ใคร
How to อย่างไร
How muct เท่าไหร่
การกําหนดปัญหาและสิ่งที่ต้องการจากข้อมูลที่มีอยู่ด้วยการตั้งคําถามที่เหมาะสมเพื่อนําไปสู่ ปัญหาและการแก้ปัญหา ซึ่งการกําหนดปัญหาหรือการตั้งคําถาม คือ ขั้นตอนแรกในการใช้วิทยาการข้อมูล
ขั้นตอนที่ 4 การวิเคราะห์ข้อมูล (Analyze the data)
การวิเคราะห์ข้อมูล คือ กระบวนการวิเคราะห์ข้อมูลเพื่อค้นหารูปแบบที่เชื่อมโยงกันของข้อมูล ค้นหา จุดผิดปกติเพื่อทดสอบสมมติฐาน หรือเพื่อตรวจสอบสมมติฐานด้วยทฤษฎีทางสถิติและการใช้ภาพ หรือแผนผัง กราฟิกต่าง ๆ มาช่วยอธิบายการวิเคราะห์ข้อมูล โดยสมมติฐานเหล่านี้จะประกอบด้วยตัวแปรต่าง ๆ และการ วิเคราะห์ข้อมูลจะวิเคราะห์ทีละตัวแปรเพื่อให้ได้ผลลัพธ์ ซึ่งการวิเคราะห์ข้อมูลที่ดีนั้นผู้วิเคราะห์จําเป็นต้อง
เข้าใจข้อมูลที่มีอยู่อย่างลึกซึ้ง จึงจะทําให้ได้ผลลัพธ์ที่มีคุณภาพ
ขั้นตอนที่ 3 การสํารวจข้อมูล (Explore the data)
ขั้นตอนนี้จะเป็นการทดลองวาดแผนภาพ หรือกราฟของข้อมูลในรูปแบบต่าง ๆ เพื่อพิจารณา ภาพรวมของข้อมูล ระหว่างการสํารวจอาจจะพบข้อผิดพลาดหรือปัญหาอื่น ๆ จากการตั้งคําถาม หรือการเก็บ รวบรวมข้อมูล ซึ่งทําให้ต้องกลับไปดําเนินการแก้ไขให้ถูกต้อง เช่น พบว่าข้อมูลสูญหาย ข้อมูลผิดรูปแบบ ข้อมูลมีค่าผิดปกติใด
ขั้นตอนที่ 5 การสื่อสารและการทําผลลัพธ์ให้เป็นภาพ (Communicate and visualize the
results)
ขั้นตอนนี้เป็นขั้นตอนการนําผลการวิเคราะห์ข้อมูลที่ได้จากขั้นตอนก่อนหน้านี้มานําเสนอในลักษณะที่ ง่ายในการทําความเข้าใจ และนําไปสู่การตัดสินใจต่าง ๆ จากข้อมูลที่ได้ทําการวิเคราะห์ อีกทั้งผู้ที่อ่านผลการ วิเคราะห์นั้นอาจไม่มีความชํานาญด้านวิทยาการข้อมูล ส่งผลให้อาจไม่เข้าใจในสิ่งที่นักวิทยาศาสตร์ข้อมูล ต้องการสื่อสาร โดยเทนนิคที่นิยมมีหลายเทคนิค เช่น กราฟ อินโฟกราฟิก