Please enable JavaScript.
Coggle requires JavaScript to display documents.
การทำเหมืองข้อมูล - Coggle Diagram
การทำเหมืองข้อมูล
ขั้นตอน
- การแปลงรูปแบบข้อมูล (Data Reduction and Transformation) เป็นการลดรูปและจัดข้อมูลให้อยู่ในรูปแบบเดียวกันที่ได้มาตรฐาน และเหมาะสมที่จะนำไปใช้กับอัลกอริทึมและแบบจำลองที่ใช้ทำเหมืองข้อมูล
- การทำเหมืองข้อมูล (Data Mining)เป็นขั้นตอนที่นำเอาวิธีการหรือเทคนิคการทำเหมืองข้อมูลมาใช้เพื่อหารูปแบบของความรู้ความรู้
- การกรองข้อมูลและเตรียมการประมวลผล (Data Cleaning and Preprocessing) ข้อมูลที่เก็บไว้จำนวนมากจะถูกนำมากรองเพื่อเลือกข้อมูลที่ตรงประเด็นเพื่อนำไปวิเคราะห์ได้อย่างเหมาะสม
- การแปลผลและการประเมินผล (Interpretation/Evaluation)เป็นขั้นตอนการประเมินรูปแบบที่ได้จากการทำเหมืองข้อมูล ประเมินผล โดยเป็นการวิเคราะห์ผลลัพธ์ที่ได้และแปลความหมายว่าผลลัพธ์ความรู้นั้นเหมาะสมหรือตรงวัตถุประสงค์หรือไม่
- คัดเลือกข้อมูล (Data Selection) เป็นการระบุถึงแหล่งข้อมูลที่จะนำมาทำเหมืองข้อมูล รวมถึงการนำข้อมูลที่ต้องการออกจากฐานข้อมูลเพื่อสร้างกลุ่มข้อมูลส าหรับพิจารณาเบื้องต้น
- การแทนความรู้ (Knowledge Representation)เป็นขั้นตอนการนำเสนอความรู้ที่ค้นพบ โดยใช้เทคนิคในการนำเสนอเพื่อให้เข้าใจและการนำองค์ความรู้นั้นไปประยุกต์ใช้งาน
ประเภท
- การทำนาย (Prediction)คล้ายการประมาณค่า แต่ผลการทำนายจะใช้งานในอนาคต เช่น ทำนายยอดขายที่จะเกิดขึ้นใน 3 เดือนข้างหน้า ทำนายอัตราการเกิดอุบัติเหตุบนท้องถนนในปีหน้า
- การจำแนกกลุ่ม (Classification)
จำแนกข้อมูลโดยอาศัยข้อมูลจากข้อมูลชุดเรียนรู้ (Training DataSet) เช่น การจำแนกอาการผู้ป่วยพร้อมกับแนะนำยารักษา การจำแนกรายได้ประชากรและข้อมูลความสัมพันธ์ที่ส่งผลให้เกิดรายได้ดังกล่าว เช่น อาชีพ ระดับการศึกษา เพศ อายุ
- การประมาณค่า (Estimation)ประมาณค่าจากตัวแปรที่สนใจ เช่น การประมาณค่าเกรดเฉลี่ยสะสมของนักศึกษาปริญญาโท จากค่าเกรดเฉลี่ยสะสมในระดับปริญญาตรี
- การอธิบายผล / การพรรณนา (Description)การทำเหมืองข้อมูลเพื่อใช้ในการอธิบายหรือแปลความหมายและอธิบายข้อมูลได้อย่างชัดเจน
- การจัดกลุ่ม (Clustering)รวบรวมข้อมูลที่มีลักษณะคล้ายคลึงกันให้อยู่ที่กลุ่มเดียวกัน ส่วนข้อมูลใดที่มีค่าแตกต่างก็จัดให้อยู่ในกลุ่มอื่น ๆ
- ความสัมพันธ์ (Association)การหาความสัมพันธ์ของข้อมูลที่สนใจ โดยอาศัยกฎความสัมพันธ์ระหว่างคุณลักษณะ 2 คุณลักษณะ เช่น สินค้าใดบ้างที่ลูกค้าชอบซื้อและไม่ชอบซื้อร่วมกันหาสัดส่วนยาและแสดงผลข้างเคียงที่เป็นอันตรายต่อผู้ป่วย
ความหมาย
ความหมายที่ 1
กระบวนการกระทำกับข้อมูลจำนวนมาก เพื่อหาความสัมพันธ์ต่าง ๆ ของข้อมูลที่ซ่อนอยู่โดยทำการเชื่อมโยงข้อมูลที่มีความสัมพันธ์กัน การจัดลำดับข้อมูล การจำแนกประเภทข้อมูล การแบ่งกลุ่มข้อมูล การหารูปแบบของข้อมูล เพื่อให้ได้องค์ความรู้ใหม่ที่สามารถนำไปใช้ประกอบการตัดสินใจ
ความหมายที่ 2
การค้นหาความรู้ที่เป็นประโยชน์และน่าสนใจบนฐานข้อมูลขนาดใหญ่(Knowledge Discovery from very large in Databases – KDD) โดยนำข้อมูลที่มีอยู่มาวิเคราะห์แล้วดึงความรู้ในส่วนที่สำคัญออกมาวิเคราะห์หรือทำนายสิ่งต่าง ๆ ที่เกิดขึ้นการค้นหาความรู้ที่แฝงอยู่ในข้อมูลเป็นกระบวนการขุดค้นสิ่งที่สนใจ
ประโยชน์
-
-
ด้านการพัฒนาเว็บไซต์ เช่น การโฆษณา, การเพิ่มประสิทธิภาพและความสามารถของ Search Engine
ด้านการเงิน เช่น ควรอนุมัติเครดิตให้ลูกค้ารายใดบ้าง, คาดการความน่าจะเป็นว่า
ธุรกิจนั้นมีโอกาสล้มละลายหรือไม่
-
-
-