Please enable JavaScript.
Coggle requires JavaScript to display documents.
การทำเหมืองข้อมูล - Coggle Diagram
การทำเหมืองข้อมูล
ขั้นตอน
- การทำเหมืองข้อมูล (Data Mining) เป็นขั้นตอนที่นำเอาวิธีการหรือเทคนิคการทำเหมืองข้อมูลมาใช้เพื่อหารูปแบบของความรู้
- คัดเลือกข้อมูล (Data Selection) เป็นการระบุถึงแหล่งข้อมูลที่จะนำมาทำเหมืองข้อมูล รวมถึงการนำข้อมูลที่ต้องการ ออกจากฐานข้อมูลเพื่อสร้างกลุ่มข้อมูลสำหรับพิจารณาเบื้องต้น
- การแปลงรูปแบบข้อมูล (Data Reduction and Transformation) เป็นการลดรูปและจัดข้อมูลให้อยู่ในรูปแบบเดียวกันที่ได้มาตรฐาน และเหมาะสมที่จะนำไปใช้กับอัลกอริทึมและแบบจำลองที่ใช้ทำเหมืองข้อมูล
- การกรองข้อมูลและเตรียมการประมวลผล (Data Cleaning and Preprocessing) ข้อมูลที่เก็บไว้จำนวนมากจะถูกนำมากรองเพื่อเลือกข้อมูลที่ตรงประเด็นเพื่อนำไป วิเคราะห์ได้อย่างเหมาะสม
- การแปลผลและการประเมินผล(Interpretation/Evaluation) เป็นขั้นตอนการประเมินรูปแบบที่ได้จากการทำเหมืองข้อมูล ประเมินผล โดยเป็นการวิเคราะห์ผลลัพธ์ที่ได้และแปลความหมายว่าผลลัพธ์ความรู้นั้นเหมาะสมหรือตรงวัตถุประสงค์หรือไม่
- การแทนความรู้ (Knowledge Representation) เป็นขั้นตอนการนำเสนอความรู้ที่ค้นพบ โดยใช้เทคนิคในการนำเสนอเพื่อให้เข้าใจ และการนำองค์ความรู้นั้นไปประยุกต์ใช้งาน
ประเภท
- การอธิบายผล การพรรณนา (Description) การทำเหมืองข้อมูลเพื่อใช้ในการอธิบายหรือแปลความหมายและอธิบายข้อมูลได้ อย่างชัดเจน
- การประมาณค่า (Estimation) ประมาณค่าจากตัวแปรที่สนใจ เช่น การประมาณค่าเกรดเฉลี่ยสะสมของนักศึกษา ปริญญาโท จากค่าเกรดเฉลี่ยสะสมในระดับปริญญาตรี
- การทำนาย (Prediction) คล้ายการประมาณค่า แต่ผลการทำนายจะใช้งานในอนาคต เช่น ทำนายยอดขายที่ จะเกิดขึ้นใน 3 เดือนข้างหน้า ทำนายอัตราการเกิดอุบัติเหตุบนท้องถนนในปีหน้า
- การจำแนกกลุ่ม (Classification) จำแนกข้อมูลโดยอาศัยข้อมูลจากข้อมูลชุดเรียนรู้ (Training DataSet) เช่น การจำแนกอาการผู้ป่วยพร้อมกับแนะนำยารักษา การจำแนกรายได้ประชากรและข้อมูล ความสัมพันธ์ที่ส่งผลให้เกิดรายได้ดังกล่าว เช่น อาชีพ ระดับการศึกษา เพศ อายุ
- การจัดกลุ่ม (Clustering) รวบรวมข้อมูลที่มีลักษณะคล้ายคลึงกันให้อยู่ที่กลุ่มเดียวกัน ส่วนข้อมูลใดที่มีค่า แตกต่างก็จัดให้อยู่ในกลุ่มอื่น ๆ
- ความสัมพันธ์ (Association) การหาความสัมพันธ์ของข้อมูลที่สนใจ โดยอาศัยกฎความสัมพันธ์ระหว่าง คุณลักษณะ 2 คุณลักษณะ เช่น สินค้าใดบ้างที่ลูกค้าชอบซื้อและไม่ชอบซื้อร่วมกัน หาสัดส่วนยาและแสดงผลข้างเคียงที่เป็นอันตรายต่อผู้ป่วย
ความหมาย
ความหมายที่ 1 กระบวนการกระทำกับข้อมูลจำนวนมาก เพื่อหาความสัมพันธ์ต่าง ๆของข้อมูลที่ซ่อนอยู่ โดยทำการเชื่อมโยงข้อมูลที่มีความสัมพันธ์กัน การจัดลำดับข้อมูล การจำแนกประเภทข้อมูล การแบ่งกลุ่มข้อมูล การหารูปแบบของข้อมูล เพื่อให้ได้องค์ความรู้ใหม่ที่สามารถนำไปใช้ประกอบการตัดสินใจ และการพยากรณ์ในด้านต่าง ๆ เช่น การตลาด การส่งเสริมการขาย ด้านธุรกิจ ด้านการแพทย์
ความหมายที่ 2 การค้นหาความรู้ที่เป็นประโยชน์และน่าสนใจบนฐานข้อมูลขนาดใหญ่ (Knowledge Discovery from very large in Databases – KDD) โดยนำข้อมูลที่มีอยู่มาวิเคราะห์แล้วดึงความรู้ในส่วนที่สำคัญออกมาวิเคราะห์หรือทำนายสิ่งต่างๆที่เกิดขึ้น การค้นหาความรู้ที่แฝงอยู่ในข้อมูลเป็นกระบวนการขุดค้นสิ่งที่สนใจ ซึ่งแตกต่างกับระบบฐานข้อมูลที่ต้องอาศัยคำสั่ง แต่การทำเหมืองข้อมูลจะมีวิธีการที่เรียกว่า Machine Learning Tools
วัตถุประสงค์
- การสร้างการพยากรณ์ เป็นการปฏิบัติการที่ใช้สาระที่มีอยู่ในฐานข้อมูลซึ่งเป็นข้อมูลที่เกิดขึ้นแล้ว มาสร้าง การพยากรณ์ข้อมูลที่จะเกิดในอนาคต โดยใช้วิธีการวิเคราะห์เชิงสถิติเป็นพื้นฐาน และ เสริมด้วยการทำเหมืองข้อมูล เพื่อให้สามารถสร้างการพยากรณ์ข้อมูลที่ง่ายต่อการทำความเข้าใจมากขึ้น
- การวิเคราะห์ความเชื่อมโยงหรือความสัมพันธ์ เป็นการปฏิบัติการเพื่อสร้างความสัมพันธ์ระหว่าง ข้อมูลต่าง ๆ ในฐานข้อมูล
ประโยชน์
• ด้านการพัฒนาเว็บไซต์ เช่น การโฆษณา, การเพิ่มประสิทธิภาพและความสามารถ ของ Search Engine
• ด้านวิทยาศาสตร์เช่น การค้นหายารักษาโรค ดาราศาสตร์
• ด้านธุรกิจ เช่น การเจาะกลุ่มตลาด การวางแผนด้านการผลิต จัดการกลุ่มลูกค้าการโฆษณา เป็นต้น
• ด้านการเงิน เช่น ควรอนุมัติเครดิตให้ลูกค้ารายใดบ้าง, คาดการความน่าจะเป็นว่า ธุรกิจนั้นมีโอกาสล้มละลายหรือไม่
• ด้านการเกษตร เช่น จำแนกประเภทโรคของพืช • ด้านอาชญวิทยา เช่น วิเคราะห์ลายนิ้วมือ
• ด้านอวกาศ เช่น วิเคราะห์ข้อมูลที่ส่งมาจากดาวเทียม