Please enable JavaScript.
Coggle requires JavaScript to display documents.
บทที่2เทคโนโลยีการจัดการข้อมูล, ความรู้ที่ได้จากการทำเหมืองข้อมูลมีหลายรูป…
บทที่2เทคโนโลยีการจัดการข้อมูล
ระบบฐานข้อมูล
2.ฐานข้อมูล
ระบบการจัดการข้อมูลเชิงสัมพันธ์
ฐานข้อมูลเชิงสัมพันธ์ นั้นหมายความว่า จะมีการจัดเก็บข้อมูลในลักษณะที่เป็นกลุ่มของข้อมูลที่มีความสัมพันธ์กัน ในฐานข้อมูลหนึ่งๆ สามารถที่จะมีตารางตั้งแต่ 1 ตารางเป็นต้นไป และในแต่ละตารางนั้นก็สามารถมีได้หลายคอลัมน์ (Column) หลายแถว (Row) ตัวอย่างเช่น เราต้องการเก็บข้อมูลพนักงาน ในตารางของข้อมูลพนักงานก็จะประกอบด้วย ...
คือการจัดเก็บข้อมูลและบริหารข้อมูลเพื่อให้ข้อมูลมีความเป้นระบบสามารถเข้าถึงข้อมูลได้ง่ายสะดวกในการสืบค้น
ระบบฐานข้อมูล
ประโยชย์
เกิดความเป็นอิสระของข้อมูล
ระบบที่ใช้สำหรับจัดเก็บและข้อมูลโดยข้อมูลที่จัดเก็บต้องมีความสัมพันธ์กันระหว่างข้อมูลที่ชัดเจน
1.ฐานข้อมูลแหล่งเก็ฐ
2.ซอฟต์แวร์ระบบที่ใช้จัดการข้อมูล
3.ฮาร์ดแวร์หรือระบบจัดฐานข้อมูล
ผู้ใช้งาน
1.ลดความซ้ำซ้อนของข้อมูล ...
2.รักษาความถูกต้องของข้อมูล ...
มีความเป็นอิสระของข้อมูล ...
มีความปลอดภัยของข้อมูลสูง ...
ใช้ข้อมูลร่วมกันโดยมีการควบคุมจากศูนย์กลาง
1.ข้อมูล
ความหมายของข้อมูล
สิ่งต่าง ๆ หรือข้อเท็จจริง ที่ได้รับจากประสาทสัมผัส หรือสื่อต่าง ๆที่ยังไม่ผ่านการวิเคราะห์หรือการประมวลผล โดยข้อมูล อาจเป็นตัวเลข สัญลักษณ์ตัวอักษร เสียง ภาพ ภาพเคลื่อนไหว เป็นต้น
ตัวอย่างข้อมูลแต่ล่ะประเภท
ข้อมูลที่ประกอบด้วยตัวอักษรทั้งภาษาไทยหรือภาษาต่างประเทศ เช่น ชื่อ - นามสกุล ประวัติโรงเรียน เป็นต้น และข้อความที่เป็นตัวเลขซึ่งไม่นำไปใช้ในการคำนวณ เช่น ป้ายทะเบียนรถ บ้านเลขที่ เลขที่บัตรประชาชน เป็นต้น
ลักษณะของข้อมูล
ข้อมูลที่มีโครงสร้าง
เป็นข้อมูลที่การจัดระเบีบย มีรูปแบบ และ ประเภทข้อมูลที่ชัดเจน
ข้อมูลกึ่งมีโครงสร้าง
ชุดข้อมูลที่มีโครงสร้างระดับหนึ่งแต่ยังไม่สมบูรณ์ เช่น สเตตัสใน Social Media เป็นข้อมูลที่ไม่มีโครงสร้าง แต่ในกรณีที่มี Hashtag (#) เข้ามาช่วยในการจัดหมวดหมู่ จะทำให้ข้อมูลมี
ข้อมูลที่ไม่มีโครงสร้าง
ชุดข้อมูลที่มีโครงสร้างไม่ชัดเจน หรือไม่สามารถระบุความแน่นอนของข้อมูลนั้นๆ ได้ ยังไม่สามารถประมวลผลเพื่อนำไปใช้ได้ทันที อย่างเช่น บทสนทนาโต้ตอบกับลูกค้าทาง Social Media.
3.คลังข้อมูล
โดยปกติแล้ว ฐานข้อมูลในองค์กรทั่วไปจะมีลักษณะที่ค่อนข้างทันต่อเหตุการณ์ เช่น ฐานข้อมูลพนักงานก็จะเก็บเฉพาะพนักงานในปัจจุบัน จะไม่สนใจข้อมูลพนักงานเก่า ๆ ในอดีต ซึ่งอาจจะมีข้อมูลอะไรบางอย่าง ที่มีประโยชน์สำหรับผู้บริหาร ในการวิเคราะห์ประสิทธิภาพและคุณลักษณะต่าง ๆ ขององค์กร. นอกจากนี้ ฐานข้อมูลแต่ละอันมักถูกออกแบบมาใช้เก็บข้อมูลเฉพาะด้าน จึงมีข้อมูลเฉพาะบางส่วนขององค์กรเท่านั้น ฉะนั้นคลังข้อมูลจึงถูกออกแบบมา เพื่อรวบรวมข้อมูลในทุกส่วนของทั้งบริษัท ทั้งเก่าและใหม่ไว้ด้วยกัน ไม่มีการลบทิ้งข้อมูลเก่า ๆ ที่ไม่จริงในปัจจุบัน
ลักษณะเด่นของคลังข้อมูล
ให้ผลตอบแทนจากการลงทุนที่สูง ถึงแม้ว่าจะมีการลงทุนที่ต่ำก็ตาม
เนื่องจากมีการให้ให้ผลตอบแทนจากการลงทุนที่สูง จึงสามารถทำให้องค์กรเกิดความได้เปรียบคู่แข่งขันในแง่ของการได้รับข้อมูลและสารสนเทศก่อนคู่แข่งขันเสมอ จึงทำให้สามารถวิเคราะห์ข้อมูลเหล่านั้นเพื่อทำการกำหนดเป็นกลยุทธ์ และกำหนดทิศทางในการดำเนินงานได้ก่อนคู่แข่งขัน เช่น พฤติกรรมของผู้บริโภค ความต้องการทางตลาด และแนวโน้มความต้องการของผู้บริโภค
เพิ่มประสิทธิภาพในการตัดสินใจของผู้ตัดสินใจ เนื่องจากคลังข้อมูลได้รับการให้ข้อมูลที่รับมาจากแหล่งข้อมูลที่แตกต่างกัน มีความสอดคล้องกัน และวิเคราะห์ตามประเด็นที่ผู้ตัดสินใจต้องการ อีกทั้งข้อมูลที่มีอยู่ในคลังข้อมูลก็มีปริมาณมากทั้งข้อมูลในอดีตและปัจจุบัน จึงทำให้การตัดสินใจมีประสิทธิภาพมากขึ้นอีกด้วย
ทำให้สะดวกและรวดเร็วในการค้นหาข้อมูลต่างๆ และลดความซ้ำซ้อนกันของข้อมูลอีกด้วย
4.การทำเหมือนข้อมูล
ความหมาย
การทำเหมืองข้อมูล (อังกฤษ: data mining) เป็นกระบวนการในการค้นหารูปแบบในชุดข้อมูลขนาดใหญ่ โดยใช้วิธีการของการเรียนรู้ของเครื่อง สถิติ และระบบฐานข้อมูล[1][2] การทำเหมืองข้อมูลเป็นขั้นตอนวิธีการในการ"การค้นหาความรู้ในฐานข้อมูล" (knowledge discovery in databases - KDD) การทำเหมืองข้อมูลเป็นเทคนิคเพื่อค้นหารูปแบบ (pattern) ของจากข้อมูลจำนวนมหาศาลโดยอัตโนมัติ โดยใช้ขั้นตอนวิธีจากวิชาสถิติ การเรียนรู้ของเครื่อง และ การรู้จำแบบ หรือในอีกนิยามหนึ่งการทำเหมืองข้อมูล คือ กระบวนการที่กระทำกับข้อมูล(โดยส่วนใหญ่จะมีจำนวนมาก) เพื่อค้นหารูปแบบ แนวทาง และความสัมพันธ์ที่ซ่อนอยู่ในชุดข้อมูลนั้น โดยอาศัยหลักสถิติ การรู้จำ การเรียนรู้ของเครื่อง และหลักคณิตศาสตร์
นตอนการทำเหมืองข้อมูล
ทำความเข้าใจปัญหา
ทำความเข้าใจข้อมูล
เตรียมข้อมูล
สร้างแบบจำลอง
ประเมิน
นำไปใช้งาน
กฎความสัมพันธ์ (Association rule)
การจำแนกประเภทข้อมูล (Data classification)
หากฎเพื่อระบุประเภทของวัตถุจากคุณสมบัติของวัตถุ เช่น หาความสัมพันธ์ระหว่างผลการตรวจร่างกายต่าง ๆ กับการเกิดโรค โดยใช้ข้อมูลผู้ป่วยและการวินิจฉัยของแพทย์ที่เก็บไว้ เพื่อนำมาช่วยวินิจฉัยโรคของผู้ป่วย หรือการวิจัยทางการแพทย์ ในทางธุรกิจจะใช้เพื่อดูคุณสมบัติของผู้ที่จะก่อหนี้ดีหรือหนี้เสีย เพื่อประกอบการพิจารณาการอนุมัติเงินกู้
การแบ่งกลุ่มข้อมูล (Data clustering)
แบ่งข้อมูลที่มีลักษณะคล้ายกันออกเป็นกลุ่ม แบ่งกลุ่มผู้ป่วยที่เป็นโรคเดียวกันตามลักษณะอาการ เพื่อนำไปใช้ประโยชน์ในการวิเคราะห์หาสาเหตุของโรค โดยพิจารณาจากผู้ป่วยที่มีอาการคล้ายคลึงกัน
การสร้างมโนภาพ (Visualization)
สร้างภาพคอมพิวเตอร์กราฟิกที่สามารถนำเสนอข้อมูลมากมายอย่างครบถ้วนแทนการใช้ขัอความนำเสนอข้อมูลที่มากมาย เราอาจพบข้อมูลที่ซ้อนเร้นเมื่อดูข้อมูลชุดนั้นด้วยจินตทัศน์
ความรู้ที่ได้จากการทำเหมืองข้อมูลมีหลายรูปแบบ ได้แก่