Please enable JavaScript.
Coggle requires JavaScript to display documents.
กระบวนการวิทยาการข้อมูล (Data science process) - Coggle Diagram
กระบวนการวิทยาการข้อมูล (Data science process)
.
ขั้นตอนที่1การตั้งคำถาม :
จะขายเท่าไร (How much)
จะขายให้ใคร (Whom)
จะเริ่มขายเมื่อไร (When)
จะขายอะไร (What)
จะขายที่ไหน (Where)
ทําไมต้องเพิ่มยอดขาย (Why)
ใครจะเป็นคนขาย (Who)
จะขายอย่างไร (How to)
.
ขั้นตอนที่2การรวบรวมข้อมูล
กลุ่มลูกค้าเป็นใคร หรือกลุ่มใด”
เก็บข้อมูลรายละเอียดลูกค้า เช่น เพศ อายุ ประเภทสินค้าที่นิยมสั่งซื้อ จากข้อมูลการขายที่มีการ
เมื่อกําหนดปัญหาเรียบร้อยแล้ว ขั้นตอนถัดไปคือ การหาข้อมูลเพื่อนํามาตอบคําถามต่าง ๆ ที่ได้ก ขั้นตอนที่ 1 ซึ่งการเก็บข้อมูลนี้จะต้องอาศัยกระบวนการเก็บข้อมูลที่เหมาะสมและมีคุณภาพเพียงพอ เพื่อให้ ได้ข้อมูลเชิงลึกที่จําเป็น ซึ่งจะนําไปสู่ขั้นตอนการสํารวจข้อมูล และการวิเคาระห์ข้อมูลต่อไป
ขั้นตอนที่3การสํารวจข้อมูล (Explore the data)
ขั้นตอนนี้จะเป็นการทดลองวาดแผนภาพ หรือกราฟของข้อมูลในรูปแบบต่าง ๆ เพื่อพิจารณา ภาพรวมของข้อมูล ระหว่างการสํารวจอาจจะพบข้อผิดพลาดหรือปัญหาอื่น ๆ จากการตั้งคําถาม หรือการเก็บ รวบรวมข้อมูล ซึ่งทําให้ต้องกลับไปดําเนินการแก้ไขให้ถูกต้อง เช่น พบว่าข้อมูลสูญหาย ข้อมูลผิดรูปแบบ ข้อมูลมีค่าผิดปกติ
.
• โครงสร้างของข้อมูลที่แตกต่างกัน เช่น ข้อมูลลูกค้าบางรายอยู่ในรูปแบบฐานข้อมูล แต่ลูกค้าราย อื่นอยู่ในโครงสร้าง CSV หรือ XM
ความไม่เข้ากันของข้อมูล เช่น ลูกค้าบางรายอาจระบุข้อมูลวัน/เดือน/ปีเกิด เป็น วัน/เดือน/ปี แต่ ลูกค้าบางรายอาจระบุเป็น เดือน/วัน/ปี
ความไม่ถูกต้องของข้อมูล เช่น ลูกค้าบางรายอาจระบุวัน/เดือน/ปีเกิดผิดประเภท โดยข้อมูลที่ ถูกต้องควรจะเป็นข้อมูลประเภทวันที่ แต่ลูกค้าอาจจะระบุเป็นตัวอักษร
ขั้นตอนที่ 5 การสื่อสารและการทําผลลัพธ์ให้เป็นภาพ
ตัวอย่างการนําเสนอผลการวิเคราะห์ “กลุ่มเป้าหมายที่เหมาะสมสําหรับสินค้าประเภทหนึ่ง”
ขั้นตอนนี้เป็นขั้นตอนการนําผลการวิเคราะห์ข้อมูลที่ได้จากขั้นตอนก่อนหน้านี้มานําเสนอในลักษณะที่ ง่ายในการทําความเข้าใจ และนําไปสู่การตัดสินใจต่าง ๆ จากข้อมูลที่ได้ทําการวิเคราะห์ อีกทั้งผู้ที่อ่านผลการ วิเคราะห์นั้นอาจไม่มีความชํานาญด้านวิทยาการข้อมูล ส่งผลให้อาจไม่เข้าใจในสิ่งที่นักวิทยาศาสตร์ข้อมูล ต้องการสื่อสาร โดยเทนนิคที่นิยมมีหลายเทคนิค เช่น กราฟ อินโฟกราฟิก
ขั้นตอนที่ 4 การวิเคราะห์ข้อมูล (Analyze the data)
.
โดยใช้สมมติฐาน “กลุ่มเป้าหมายลูกค้าสําหรับสินค้าประเภทหนึ่ง” ซึ่ง มาจากคําถาม “กลุ่มลูกค้าเป็นใคร หรือกลุ่มใด”
สมมติฐาน “กลุ่มเป้าหมายลูกค้าสําหรับสินค้า
ตัวแปร
ช่วงอายุของลูกค้า
เพศของลูกค้า
ประเภทสินค้าที่นิยมสั่งซื้อ สถิติการสั่งซื้อสินค้าของลูกค้า
จากรายละเอียดสมมติฐาน และตัวแปรข้างต้น การวิเคราะห์ข้อมูลจะใช้กระบวนการทางสถิติมา วิเคราะห์ข้อมูลหาผลลัพธ์ที่ละตัวแปร เพื่อให้ได้กลุ่มเป้าหมายที่เหมาะสมสําหรับสินค้า
การวิเคราะห์ข้อมูล คือ กระบวนการวิเคราะห์ข้อมูลเพื่อค้นหารูปแบบที่เชื่อมโยงกันของข้อมูล ค้นหา จุดผิดปกติเพื่อทดสอบสมมติฐาน หรือเพื่อตรวจสอบสมมติฐานด้วยทฤษฎีทางสถิติและการใช้ภาพ หรือแผนผัง กราฟิกต่าง ๆ มาช่วยอธิบายการวิเคราะห์ข้อมูล โดยสมมติฐานเหล่านี้จะประกอบด้วยตัวแปรต่าง ๆ และการ วิเคราะห์ข้อมูลจะวิเคราะห์ทีละตัวแปรเพื่อให้ได้ผลลัพธ์ ซึ่งการวิเคราะห์ข้อมูลที่ดีนั้นผู้วิเคราะห์จําเป็นต้อง
เข้าใจข้อมูลที่มีอยู่อย่างลึกซึ้ง จึงจะทําให้ได้ผลลัพธ์ที่มีคุณภาพ