Please enable JavaScript.
Coggle requires JavaScript to display documents.
ความรู้พื้นฐานเกี่ยวกับการจัดการข้อมูลขนาดใหญ่ - Coggle Diagram
ความรู้พื้นฐานเกี่ยวกับการจัดการข้อมูลขนาดใหญ่
:
ประวัติและความเป็นมาของข้อมูลขนาดใหญ่
ประมาณปี ค.ศ 2005 เริ่มมีการตระหนักถึงข้อมูลปริมาณมากที่ผู้คนได้สร้างขึ้นมาผ่านสื่อออนไลน์ เช่น เฟซบุ๊ก ยูทูบ และสื่ออนไลน์แบบอื่นๆ ฮาดูป เป็นโอเพนซอร์สเฟรมเวิร์กที่ถูกสร้างขึ้นมาในช่วงเวลา เดียวกันให้เป็นที่เก็บและวิเคราะห์ข้อมูลขนาดใหญ่ และในช่วงเวลาเดียวกันโนเอสคิวแอล ได้เริ่มขึ้นและได้รับวามนิยมมากขึ้น การพัฒนาโอเพนชอร์สเฟรมเวิร์ก เช่นฮาปู มีความสำคัญต่อการเติบโตของข้อมูลขนาดใหญ่ เนื่องจากทำให้ข้อมูลขนาดใหญ่ทำงานได้ง่ายและประหยัดกว่า ปริมาณข้อมูลขนาดใหญ่ได้เพิ่มขึ้นอย่างรวดเร็ว ผู้คนยังงสร้างข้อมูลจำนวนมาก
ความหมายและความสำคัญของการจัดการข้อมูลขนาดใหญ่
1.ความหมายของข้อมูลขนาดใหญ่
บิ๊กดาต้าเป็นคำนิยามของข้อมูลที่มีขนาดใหญ่ทุกชนิดที่อยู่ในองค์กร ไม่ว่าจะเป็น ข้อมูลบริษัท ข้อมูลลูกค้า ข้อมูลผู้จัดหาสินค้าและวัตถุดิบ พฤติกรรมผู้บริโภคไฟล์เอกสารต่างๆ ที่เกี่ยวข้องทั้งหมดรวมถึงรูปภาพ ที่อยู่ของข้อมูลในอินเทอร์เน็ต(URL) การเชื่อมโยงต่างๆ (Link) ที่เก็บไว้ปริมาณมาก จนกระทั่งซอฟต์แวร์หรือฮาร์ดแวร์ปกติทั่วไปไม่สามารถรองรับการเก็บข้อมูลหรือประมวลผลได้อย่างเต็มปรสิทธิภาพ
2.ความสำคัญของข้อมูลขนาดใหญ่
บิ๊กดาต้าช่วยให้สามารถใช้ข้อมูลจากทุกแหล่งที่เป็นไปได้ บางองค์กรอาจสามารถใช้ประโยชน์ จากที่ข้อมูลไม่ได้ใหญ่มาก มีความสำคัญในการนำมาใช้วิเคราะห์ เพื่อให้เกิดวามเข้าใจเชิงลึก ทำให้ได้มาซึ่งความรู้ความเข้าใจใหม่ๆ ที่ไม่สามรถเห็นได้อย่างตรงไปตรงมา หรือเป็นข้อมูลที่รวบรวมจัดเก็บไว้ตลอด
ลักษณะพื้นฐานและหลักการทำงานของข้อมูลขนาดใหญ่
คำว่า บิ๊กดาต้า มักจะสื่อถึงชุดข้อมูลที่มีขนาดใหญ่ ซึ่งอาจแบ่งย่อยออกเป็นข้อมูล 3 รูปแบบ คือ
-ข้อมูลเชิงโครงสร้าง
-ข้อมูลกึ่งโครงาสร้าง
-ข้อมูลที่ไม่มีโครงสร้าง
ลักษณะข้อมูลพื้นฐานของข้อมูลขนาดใหญ่
บิกดาต้าที่มีประสิทธิภาพสูงควรมีลักษณะพื้นฐาน 6ประการ ดังนี้
1.ปริมาณ หมายถึง ปริมาณของข้อมูลควรมีจำนวนมากพอ ทำให้เมื่อนำมาวิเคราะห์แล้วจะได้ข้อมูลเชิงลึกที่ตรงกับความเป็นจริง
2.ความหลากหลาย หมายถึง รูปแบบของข้อมูลวรหลากหลายแตกต่างกันไป ทั้งแบบโครงสร้าง กึ่งโครงสร้าง ไม่มีโครงสร้าง ทำให้สามารถนำมาวิเคราะห์ประกอบกนจนได้ข้อมูลเชิงลึกครบถ้วน
3.ความเร็ว หมายถึง ลักษณะข้อมูลที่ถูกสร้างขึ้นอย่างรวดเร็ว ต่อเนื่อง และทันเหตุการณ์
4.ความถูกต้อง หมายถึง มีความน่าเชื่อถือของแหล่งที่มาข้อมูลและความถูกต้องของชุดข้อมูล
5.คุณค่า หมายถึง ข้อมูลมีประโยชน์และความสัมพันธ์ในเชิงธุรกิจ
6.ความแปรผัน หมายถึง ข้อมูลสามารถเปลี่ยนแปลงรูปแบบไปตามการใช้งาน
หลักการทำงานของบิ๊กดาต้า
ประกอบด้วย3ขั้นตอนสำคัญดังนี้
1.การรวบรวมข้อมูลของบิ๊กดาต้า เป็นการรวบรวมข้อมูลจากหลากหลายที่มาและการใช้งานที่แตกต่างกันอย่างมากมาย
2.การจัดการข้อมูล ข้อมูลขนาดใหญ่มีความต้องการสถานที่จัดเก็บขนาดใหญ่
3.การวิเคราะห์ การลงทุนสร้างข้อมูลขนาดใหญ่จะมีประโยชน์หรือคุ้มค่าก็ต่อเมื่อใช้และวิเคราะห์ข้อมูล
บทบาทของข้อมูลขนาดใหญ่ในงานด้านต่างๆ
1.บิ๊กดาต้ากับบทบาทสำคัญต่อการตลาดขนาดใหญ่
2.บิ๊กดาต้ากับบทบาทการพยากรณ์สภาพภูมิอากาศ
3.บิ๊กดาต้ากบทบาทการบริหารจัดการด้านโลจิสติกส์
4.บิ๊กดาต้ากบทบาทการบริการทางการแพทย์และสุขภาพ
5.บิ๊กดาต้ากับบทบาทด้านการศึกษา
ประโยชน์ในการนำข้อมูลขนาดใหญ่มาใช้ในงานธุรกิจและภาครัฐ
ประโยชน์ของบิ๊กดาต้าในงานธุรกิจ
1.การพัฒนาผลิตภัณฑ์ บิ๊กดาต้าช่วยดาคการณ์ความต้องการของลูกค้า การสร้างแบบจำลองเชิงคาดการณ์สำหรับผลิตภัณฑ์และบริการใหม่ๆ
2.การคาดการณ์เพื่อการบำรุงรักษาเครื่องจักร ปัจจัยที่ใช้ทรัพยากรณ์การชำรุดของเครื่องจักรนี้มาจากข้อมูลทั้งที่เป็นแบบมีโครงสร้าง และไม่มีโครงสร้าง
3.สร้างประสบการณ์ที่ดีให้กับลูกค้า ในสภาวะการแข่งขันทางการค้าในปัจจุบัน
4.การตรวจสอบการโกงและการปัฏิบัติตามกฎระเบียบ การโกงในระบบเครือข่ายอินเทอร์เน็ตไม่ได้มีเฉพาะจากนักโจรกรรมข้อมูลเท่านั้น แต่ต้องเผชิญกับผู้บุกรุกในหลายรูปแบบ
5.การเรียนรู้ของเครื่องจักร เป็นที่ได้รับความนิยมในปัจจุบันโดยเฉพาะอย่างยิ่งข้อมูลขนาดใหญ่เป็นเหตุผลที่สามารถสอนเครื่องจักรได้
6.ประสิธิภาพในการปฏิบัติงาน ในการปฏิบัติงานส่วนมากไม่ทราบว่าการดำเนินงานนั้นมีประสิธิภาพเพียงใดแต่ด้วยข้อมูลขนาดใหญ่ทำให้สามารถวิเคราะห์และเข้าถึงการผลิตหรือการปฎิบัติงานได้
7.กาขับเคลื่อนในการสร้างสรรค์สิ่งใหม่ๆ ข้อมูลขนาดใหญ่สามารถช่วยในการสร้างสรรค์สิ่งใหม่ๆ
ประโยชน์ในการนำบิ๊กดาต้ามาใช้ในงานภาครัฐ
1.การเพิ่มศักยภาพด้านการท่องเที่ยวเมืองรอง
2.การวิเคราะห์สื่อสังคมออนไลน์และพัฒนาเครื่องมือ
3.เครื่องมือประเมินช่วยัดกรองผู้กระทำผิดที่มีโอกาสย้อนกลับไปกระทำผิดซ้ำ
4.โครงการวิเคราะห์ข้อมูลค่าเบิกจ่ายสิทธิการรักษาพยาบาลจากรัฐบาล
5.การศึกษาปัจจัยเพื่อทำนายระดับความสามารถของบิดามารดา
6.การเพิ่มศักยภาพด้านการจัดเก็บภาษี
7.การวิเคราะห์รูปแบบภูมิอากาศเพื่อการวางแผนของท่าอากาศยาน
8.การจัดทำแพลตฟอร์มการรวบรวมข้อมูลเพื่อการวิเคราะห์การเปลี่ยนแปลงการดำเนินธุรกิจ
9.แนวเขตที่ดินของรัฐ
เครื่องมือที่ใช้ในการวิเคราะห์ข้อมูลขนาดใหญ่
เครื่องมือวิเคราะห์บิ๊กดาต้าและเครื่องมืออื่นๆ ที่เกี่ยวข้อง
1.ฮาดูป 2.แมปรีดิวซ์3.กริดแกน4.เอชพีซีซี5.สตรอม
เครื่องมือประเภทฐานข้อมูลหรือคลังข้อมูล
1.แคสซานดรา 2.เอชเบส 3.มอนโกดีบี