Please enable JavaScript.
Coggle requires JavaScript to display documents.
เหมืองข้อมูล - Coggle Diagram
เหมืองข้อมูล
ความหมาย
มี 2 ความหมาย
ความหมายที่ 1 กระบวนการกระทำกับข้อมูลจำนวนมาก เพื่อหาความสัมพันธ์ต่างๆ ของข้อมูลที่ซ่อนอยู่ โดยทำการเชื่อมโยงข้อมูลที่มีความสัมพันธ์กัน เพื่อให้ได้องค์ความรู้ใหม่ที่
สามารถน าไปใช้ประกอบการตัดสินใจ และการพยากรณ์ในด้านต่างๆ
-
-
-
-
-
ความหมายที่ 2
การค้นหาความรู้ที่เป็นประโยชน์และน่าสนใจบนฐานข้อมูลขนาดใหญ่ (Knowledge Discovery from very large in Databases – KDD) โดยนำข้อมูลที่มีอยู่ มาวิเคราะห์แล้วดึงความรู้ในส่วนที่สำคัญออกมาวิเคราะห์หรือทำนายสิ่งต่างๆ ที่เกิดขึ้น การค้นหาความรู้ที่แฝงอยู่ในข้อมูลเป็นกระบวนการขุดค้นสิ่งที่สนใจ ซึ่งแตกต่าง กับระบบฐานข้อมูลที่ต้องอาศัยคำสั่ง แต่การทำเหมืองข้อมูลจะมีวิธีการที่เรียกว่า Machine Learning Tools
ประเภท
มี 6 ประเภท
- การจัดกลุ่ม (Clustering) รวบรวมข้อมูลที่มีลักษณะคล้ายคลึงกันให้อยู่ที่กลุ่มเดียวกัน ส่วนข้อมูลใดที่มีค่าแตกต่างก็จัดให้อยู่ในกลุ่มอื่นๆ
- การประมาณค่า (Estimation) ประมาณค่าจากตัวแปรที่สนใจ เช่น การประมาณค่าเกรดเฉลี่ยสะสมของนักศึกษา ปริญญาโท จากค่าเกรดเฉลี่ยสะสมในระดับปริญญาตรี
- การจำแนกกลุ่ม (Classification) จำแนกข้อมูลโดยอาศัยข้อมูลจากข้อมูลชุดเรียนรู้ (Training DataSet) เช่น การจำแนกอาการผู้ป่วยพร้อมกับแนะนำยารักษา การจำแนกรายได้ประชากรและข้อมูล จำแนกอาการผู้ป่วยพร้อมกับแนะนำยารักษา การจำแนกรายได้ประชากรและข้อมูล ความสัมพันธ์ที่ส่งผลให้เกิดรายได้ดังกล่าว เช่น อาชีพ ระดับการศึกษา เพศ อายุ
- การอธิบายผล / การพรรณนา (Description) การทำเหมืองข้อมูลเพื่อใช้ในการอธิบายหรือแปลความหมายและอธิบายข้อมูลได้อย่างชัดเจน
- ความสัมพันธ์ (Association) การหาความสัมพันธ์ของข้อมูลที่สนใจ โดยอาศัยกฎความสัมพันธ์ระหว่างคุณลักษณะ 2 คุณลักษณะ เช่น สินค้าใดบ้างที่ลูกค้าชอบซื้อและไม่ชอบซื้อร่วมกัน หาสัดส่วนยาและแสดงผลข้างเคียงที่เป็นอันตรายต่อผู้ป่วย
- การทำนาย (Prediction) คล้ายการประมาณค่า แต่ผลการทำนายจะใช้งานในอนาคต เช่น ทำนายยอดขายที่จะเกิดขึ้นใน 3 เดือนข้างหน้า ทำนายอัตราการเกิดอุบัติเหตุบนท้องถนนในปีหน้า
วัตถุประสงค์
มี 2 ข้อ
- การสร้างการพยากรณ์ เป็นการปฏิบัติการที่ใช้สาระที่มีอยู่ในฐานข้อมูลซึ่งเป็นข้อมูลที่เกิดขึ้นแล้ว มาสร้างการพยากรณ์ข้อมูลที่จะเกิดในอนาคต โดยใช้วิธีการวิเคราะห์เชิงสถิติเป็นพื้นฐาน และเสริมด้วยการทำเหมืองข้อมูล เพื่อให้สามารถสร้างการพยากรณ์ข้อมูลที่ง่ายต่อการทำความเข้าใจมากขึ้น
- การวิเคราะห์ความเชื่อมโยงหรือความสัมพันธ์ เป็นการปฏิบัติการเพื่อสร้างความสัมพันธ์ระหว่างข้อมูลต่างๆ ในฐานข้อมูล
ขั้นตอน
มี 6 ขั้นตอน
- คัดเลือกข้อมูล (Data Selection) เป็นการระบุถึงแหล่งข้อมูลที่จะนำมาทำเหมืองข้อมูล รวมถึงการนำข้อมูลที่ต้องการออกจากฐานข้อมูลเพื่อสร้างกลุ่มข้อมูลสำหรับพิจารณาเบื้องต้น
- การกรองข้อมูลและเตรียมการประมวลผล (Data Cleaning and Preprocessing) ข้อมูลที่เก็บไว้จำนวนมากจะถูกนำมากรองเพื่อเลือกข้อมูลที่ตรงประเด็นเพื่อนำไปวิเคราะห์ได้อย่างเหมาะสม
- การแปลงรูปแบบข้อมูล (Data Reduction and Transformation) เป็นการลดรูปและจัดข้อมูลให้อยู่ในรูปแบบเดียวกันที่ได้มาตรฐาน และเหมาะสมที่จะนำไปใช้กับอัลกอริทึมและแบบจำลองที่ใช้ทำเหมืองข้อมูล
- การทำเหมืองข้อมูล (Data Mining) เป็นขั้นตอนที่นำเอาวิธีการหรือเทคนิคการทำเหมืองข้อมูลมาใช้เพื่อหารูปแบบของความรู้
- การแปลผลและการประเมินผล (Interpretation/Evaluation) เป็นขั้นตอนการประเมินรูปแบบที่ได้จากการทำเหมืองข้อมูล ประเมินผล โดยเป็นการวิเคราะห์ผลลัพธ์ที่ได้และแปลความหมายว่าผลลัพธ์ความรู้นั้นเหมาะสมหรือตรงวัตถุประสงค์หรือไม่
- การแทนความรู้ (Knowledge Representation) เป็นขั้นตอนการนำเสนอความรู้ที่ค้นพบ โดยใช้เทคนิคในการนำเสนอเพื่อให้เข้าใจ และการนำองค์ความรู้นั้นไปประยุกต์ใช้งาน
ประโยชน์
มี 7 ข้อ
1.ด้านการพัฒนาเว็บไซต์ เช่น การโฆษณา, การเพิ่มประสิทธิภาพและความสามารถ
ของ Search Engine
-
-
4.ด้านการเงิน เช่น ควรอนุมัติเครดิตให้ลูกค้ารายใดบ้าง, คาดการความน่าจะเป็นว่า
ธุรกิจนั้นมีโอกาสล้มละลายหรือไม่
-
-
-