Please enable JavaScript.
Coggle requires JavaScript to display documents.
กระบวนการวิทยาการข้อมูล (data science process - Coggle Diagram
กระบวนการวิทยาการข้อมูล (data science process
ขั้นตอนที่ 1
การตั้งคำถาม (ask an interesting question
what (อะไร)
where (ที่ไหน)
why (เพิ่มยอดขาย)
When (เมื่อไร)
Whom (ให้ใคร)
Woh (ใครเป็คนขาย)
How to (อย่าไร)
How much (เท่าไร)
ขั้นตอนที่ 2
เมื่อกําหนดปัญหาเรียบร้อยแล้ว ขั้นตอนถัดไปคือ การหาข้อมูลเพื่อนํามาตอบคําถามต่าง ๆ ที่ได้ก ขั้นตอนที่ 1 ซึ่งการเก็บข้อมูลนี้จะต้องอาศัยกระบวนการเก็บข้อมูลที่เหมาะสมและมีคุณภาพเพียงพอ เพื่อให้ ได้ข้อมูลเชิงลึกที่จําเป็น ซึ่งจะนําไปสู่ขั้นตอนการสํารวจข้อมูล และการวิเคาระห์ข้อมูลต่อไป
ตัวอย่างการเก็บข้อมูล เพื่อนํามาตอบคําถาม “กลุ่มลูกค้าเป็นใคร หรือกลุ่มใด”
เก็บข้อมูลรายละเอียดลูกค้า เช่น เพศ อายุ ประเภทสินค้าที่นิยมสั่งซื้อ จากข้อมูลการขายที่มีการ
เก็บข้อมูลรายละเอียดลูกค้า เช่น เพศ อายุ ประเภทสินค้าที่นิยมสั่งซื้อ จากการใช้งานเครือข่าย สังคมออนไลน์ (Social Network) ที่กําลังสนใจสินค้าประเภทเดียวกัน หรือที่เคยซื้อสินค้าประเภทเดียวกัน
หลังจากที่ได้ข้อมูลต่าง ๆ มาแล้ว ขั้นตอนต่อไปคือการทําความสะอาดข้อมูล (Data cleansing) การ แปลงข้อมูล (Data transformation) และการเชื่อมโยงข้อมูล (Conbining data) เพื่อเตรียมข้อมูลให้พร้อม สําหรับการวิเคราะห์ เนื่องจากข้อมูลเหล่านี้มาจากหลากหลายแหล่ง และอยู่ในหลากหลายรูปแบบ หรือ หลากหลายโครงสร้าง หากนําข้อมูลเหล่านี้มาผนวกรวมกันโดยไม่ผ่านการจัดเตรียมข้อมูล จะทําให้ไม่
เหมาะสมในการนําไปวิเคราะห์เพื่อให้ได้ข้อมูลเชิงลึก
ขั้นตอนที่ 3
ข้อมูล (Explore the data)
ขั้นตอนนี้จะเป็นการทดลองวาดแผนภาพ หรือกราฟของข้อมูลในรูปแบบต่าง ๆ เพื่อพิจารณา ภาพรวมของข้อมูล ระหว่างการสํารวจอาจจะพบข้อผิดพลาดหรือปัญหาอื่น ๆ จากการตั้งคําถาม หรือการเก็บ รวบรวมข้อมูล ซึ่งทําให้ต้องกลับไปดําเนินการแก้ไขให้ถูกต้อง เช่น พบว่าข้อมูลสูญหาย ข้อมูลผิดรูปแบบ ข้อมูล
ตัวอย่างข้อผิดพลาด ที่อาจเกิดขึ้นกับข้อมูลของลูกค้า จากคําถาม “กลุ่มลูกค้าเป็นใคร หรือกลุ่ม
เดือน/ปีเกิด
หน่วยการเรียนรู้ที่ 1 ข้อมูลมีคุณค่า | 1.3 กระบวนการวิทยาการข้อมูล 3
ความไม่ครบถ้วนของข้อมูลลูกค้า เช่น ลูกค้าบางรายอาจจะไม่ได้ระบุข้อมูลเพศ หรือข้อมูลวัน/
ความไม่ถูกต้องของข้อมูล เช่น ลูกค้าบางรายอาจระบุวัน/เดือน/ปีเกิดผิดประเภท โดยข้อมูลที่ ถูกต้องควรจะเป็นข้อมูลประเภทวันที่ แต่ลูกค้าอาจจะระบุเป็นตัวอักษร
ความไม่เข้ากันของข้อมูล เช่น ลูกค้าบางรายอาจระบุข้อมูลวัน/เดือน/ปีเกิด เป็น วัน/เดือน/ปี แต่ ลูกค้าบางรายอาจระบุเป็น เดือน/วัน/ปี
• โครงสร้างของข้อมูลที่แตกต่างกัน เช่น ข้อมูลลูกค้าบางรายอยู่ในรูปแบบฐานข้อมูล แต่ลูกค้าราย อื่นอยู่ในโครงสร้าง CSV หรือ XML
กระจาย
เครื่องมือพื้นฐานในการสํารวจข้อมูล เช่น กราฟ ฮิสโทแกรม
ขั้นตอนที่ 4 การวิเคราะห์ข้อมูล
การวิเคราะห์ข้อมูล คือ กระบวนการวิเคราะห์ข้อมูลเพื่อค้นหารูปแบบที่เชื่อมโยงกันของข้อมูล ค้นหา จุดผิดปกติเพื่อทดสอบสมมติฐาน หรือเพื่อตรวจสอบสมมติฐานด้วยทฤษฎีทางสถิติและการใช้ภาพ หรือแผนผัง กราฟิกต่าง ๆ มาช่วยอธิบายการวิเคราะห์ข้อมูล โดยสมมติฐานเหล่านี้จะประกอบด้วยตัวแปรต่าง ๆ
ตัวอย่างการวิเคราะห์ข้อมูล โดยใช้สมมติฐาน “กลุ่มเป้าหมายลูกค้าสําหรับสินค้าประเภทหนึ่ง” ซึ่ง มาจากคําถาม “กลุ่มลูกค้าเป็นใคร หรือกลุ่มใด”
สมมติฐาน “กลุ่มเป้าหมายลูกค้าสําหรับสินค้า
ตัวแปร
ช่วงอายุของลูกค้า
เพศของลูกค้า
ประเภทสินค้าที่นิยมสั่งซื้อ สถิติการสั่งซื้อสินค้าของลูกค้า
จากรายละเอียดสมมติฐาน และตัวแปรข้างต้น การวิเคราะห์ข้อมูลจะใช้กระบวนการทางสถิติมา วิเคราะห์ข้อมูลหาผลลัพธ์ที่ละตัวแปร เพื่อให้ได้กลุ่มเป้าหมายที่เหมาะสมสําหรับสินค้า
ขั้นตอนที่ 5
ขั้นตอนนี้เป็นขั้นตอนการนําผลการวิเคราะห์ข้อมูลที่ได้จากขั้นตอนก่อนหน้านี้มานําเสนอในลักษณะที่ ง่ายในการทําความเข้าใจ และนําไปสู่การตัดสินใจต่าง ๆ จากข้อมูลที่ได้ทําการวิเคราะห์ อีกทั้งผู้ที่อ่านผลการ วิเคราะห์นั้นอาจไม่มีความชํานาญด้านวิทยาการข้อมูล ส่งผลให้อาจไม่เข้าใจในสิ่งที่นักวิทยาศาสตร์ข้อมูล ต้องการสื่อสาร โดยเทนนิคที่นิยมมีหลายเทคนิค เช่น กราฟ อินโฟกราฟิก
ตัวอย่างการนําเสนอผลการวิเคราะห์ “กลุ่มเป้าหมายที่เหมาะสมสําหรับสินค้าประเภทหนึ่ง”
สรุป
ปัจจุบันวิทยาการข้อมูล (Data science) กําลังเข้ามามีบทบาทสําคัญในการขับเคลื่อนในด้านต่าง ๆ ของทุกประเทศ ไม่ว่าจะเป็นด้านเศรษฐกิจ ด้านสังคม ด้านสุขภาพ ด้านการเกษตร ด้านอุตสาหกรรม
กําลังสําคัญในการพัฒนาประเทศไทยให้เจริญก้าวหน้าด้วยเช่นกัน
กระบวนการของวิทยาการข้อมูล (Data science process) ประกอบด้วย การตั้งคําถาม การเก็บ รวบรวมข้อมูล การสํารวจข้อมูล การวิเคราะห์ข้อมูล และการสื่อสารและการทําผลลัพธ์ให้เป็นภาพสู่ผู้ใช้ กลุ่มเป้าหมาย