Please enable JavaScript.
Coggle requires JavaScript to display documents.
การทำเหมืองข้อมูล - Coggle Diagram
การทำเหมืองข้อมูล
ขั้นตอน
- คัดเลือกข้อมูล (Data Selection)
เป็นการระบุถึงแหล่งข้อมูลที่จะนำมาทำเหมืองข้อมูล รวมถึงการนำข้อมูลที่ต้องการออกจากฐานข้อมูลเพื่อสร้างกลุ่มข้อมูลสำหรับพิจารณาเบื้องต้น
- การกรองข้อมูลและเตรียมการประมวลผล (Data Cleaning and Preprocessing)
-
- การแปลงรูปแบบข้อมูล (Data Reduction and Transformation)
เป็นการลดรูปและจัดข้อมูลให้อยู่ในรูปแบบเดียวกันที่ได้มาตรฐาน และเหมาะสมที่จะนำไปใช้กับอัลกอริทึมและแบบจำลองที่ใช้ทำเหมืองข้อมูล
- การทำเหมืองข้อมูล (Data Mining)
-
- การแปลผลและการประเมินผล (Interpretation/Evaluation)
-
-
- การแทนความรู้ (Knowledge Representation)
เป็นขั้นตอนการนำเสนอความรู้ที่ค้นพบ โดยใช้เทคนิคในการนำเสนอเพื่อให้เข้าใจและการนำองค์ความรู้นั้นไปประยุกต์ใช้งาน
ประโยชน์
ด้านการพัฒนาเว็บไซต์
เช่น การโฆษณา, การเพิ่มประสิทธิภาพและความสามารถของ Search Engine
-
-
ด้านการเงิน
เช่น ควรอนุมัติเครดิตให้ลูกค้ารายใดบ้าง, คาดการความน่าจะเป็นว่า
ธุรกิจนั้นมีโอกาสล้มละลายหรือไม่
-
-
-
ประเภท
- การอธิบายผล / การพรรณนา (Description)
-
- การประมาณค่า (Estimation)
ประมาณค่าจากตัวแปรที่สนใจ เช่น การประมาณค่าเกรดเฉลี่ยสะสมของนักศึกษา ปริญญาโท จากค่าเกรดเฉลี่ยสะสมในระดับปริญญาตรี
คล้ายการประมาณค่า แต่ผลการท านายจะใช้งานในอนาคต เช่น ท านายยอดขายที่จะเกิดขึ้นใน 3 เดือนข้างหน้า ท านายอัตราการเกิดอุบัติเหตุบนท้องถนนในปีหน้า
- การจำแนกกลุ่ม (Classification)
จ าแนกข้อมูลโดยอาศัยข้อมูลจากข้อมูลชุดเรียนรู้ (Training DataSet)เช่น การจำแนกอาการผู้ป่วยพร้อมกับแนะน ายารักษา
การจำแนกรายได้ประชากรและข้อมูลความสัมพันธ์ที่ส่งผลให้เกิดรายได้ดังกล่าว เช่น อาชีพ ระดับการศึกษา เพศ อายุ
รวบรวมข้อมูลที่มีลักษณะคล้ายคลึงกันให้อยู่ที่กลุ่มเดียวกัน ส่วนข้อมูลใดที่มีค่า แตกต่างก็จัดให้อยู่ในกลุ่มอื่น ๆ
- ความสัมพันธ์ (Association)
-
เช่น สินค้าใดบ้างที่ลูกค้าชอบซื้อและไม่ชอบซื้อร่วมกัน
หาสัดส่วนยาและแสดงผลข้างเคียงที่เป็นอันตรายต่อผู้ป่วย
ความหมาย
ความหมายที่ 1
กระบวนการกระท ากับข้อมูลจ านวนมาก เพื่อหาความสัมพันธ์ต่าง ๆ ของข้อมูลที่ซ่อนอยู่ โดยท าการเชื่อมโยงข้อมูลที่มีความสัมพันธ์กัน
การจัดลำดับข้อมูล การจำแนก
ประเภทข้อมูล การแบ่งกลุ่มข้อมูลการหารูปแบบของข้อมูล เพื่อให้ได้องค์ความรู้ใหม่ที่สามารถนำไปใช้ประกอบการตัดสินใจ
-
ความหมายที่ 2
การค้นหาความรู้ที่เป็นประโยชน์และน่าสนใจบนฐานข้อมูลขนาดใหญ่(Knowledge Discovery from very large in Databases – KDD)
โดยนำข้อมูลที่มีอยู่มาวิเคราะห์แล้วดึงความรู้ในส่วนที่สำคัญออกมาวิเคราะห์หรือทำนายสิ่งต่าง ๆ ที่เกิดขึ้น
การค้นหาความรู้ที่แฝงอยู่ในข้อมูลเป็นกระบวนการขุดค้นสิ่งที่สนใจ ซึ่งแตกต่างกับระบบฐานข้อมูลที่ต้องอาศัยคำสั่งแต่การท าเหมืองข้อมูลจะมีวิธีการที่เรียกว่า Machine Learning Tools
วัตถุประสงคฺ์
เป็นการปฏิบัติการที่ใช้สาระที่มีอยู่ในฐานข้อมูลซึ่งเป็นข้อมูลที่เกิดขึ้นแล้ว มาสร้างการพยากรณ์ข้อมูลที่จะเกิดในอนาคต
โดยใช้วิธีการวิเคราะห์เชิงสถิติเป็นพื้นฐาน และ
เสริมด้วยการทำเหมืองข้อมูล เพื่อให้สามารถสร้างการพยากรณ์ข้อมูลที่ง่ายต่อการทำความเข้าใจมากขึ้น
- การวิเคราะห์ความเชื่อมโยงหรือความสัมพันธ์
-