Please enable JavaScript.
Coggle requires JavaScript to display documents.
ความรู้พื้นฐานการจัดการข้อมูลขนาดใหญ่ - Coggle Diagram
ความรู้พื้นฐานการจัดการข้อมูลขนาดใหญ่
ความหมายของ Big Data
big data หมาถึง ปริมาณข้อมูลที่มหาศาล ทั้งแบบข้อมูลที่มีโครงสร้างและไม่มีโครงสร้าง ซึ่งปะปนอยู่มากมายในการทำธุรกิจในแต่ละวัน หากแต่ไม่ใช่ปริมาณของข้อมูลที่เป็นสิ่งสำคัญ สิ่งสำคัญก็คือการที่องค์กรจัดการกับข้อมูลต่างหากการวิเคราะห์
วิวัฒนาการของ Big Data
ถึงแม้ว่าแนวคิดเรื่องข้อมูลขนาดใหญ่หรือ Big Data จะเป็นของใหม่และมีการเริ่มทำกันในไม่กี่ปีมานี้เอง
แต่ต้นกำเนิดของชุดข้อมูลขนาดใหญ่ได้มีการริเริ่มสร้างมาตั้งแต่ยุค 60 และในยุค 70
โลกของข้อมูลก็ได้เริ่มต้น และได้พัฒนาศูนย์ข้อมูลแห่งแรกขึ้น และทำการพัฒนาฐานข้อมูลเชิงสัมพันธ์ขึ้นมา
ประมาณปี 2005 เริ่มได้มีการตะหนักถึงข้อมูลปริมาณมากที่ผู้คนได้สร้างข้นมาผ่านสื่ออนไลน์
เช่น เฟสบุ๊ค ยูทูป และสื่ออนไลน์แบบอื่นๆ Hadoop เป็นโอเพ่นซอร์สเฟรมเวิร์คที่ถูกสร้างขึ้นมาในช่วงเวลาเดียวกันให้เป็นที่เก็บและวิเคราะห์ข้อมูลขนาดใหญ่
และในช่วงเวลาเดียวกัน NoSQL ได้ก็เริ่มขึ้นและได้รับความนิยมมากขึ้น
การพัฒนาโอเพนซอร์สเฟรมเวิร์ค เช่น Hadoop (และเมื่อเร็ว ๆ นี้ก็มี Spark)
มีความสำคัญต่อการเติบโตของข้อมูลขนาดใหญ่ เนื่องจากทำให้ข้อมูลขนาดใหญ่ทำงานได้ง่าย
และประหยัดกว่า ในช่วงหลายปีที่ผ่านมาปริมาณข้อมูลขนาดใหญ่ได้เพิ่มขึ้นอย่างรวดเร็ว
ผู้คนยังคงสร้างข้อมูลจำนวนมาก ซึ่งไม่ใช่แค่มนุษย์ที่ทำมันขึ้นมา
การพัฒนาการของ IOT (Internet of Thing) ซึ่งเป็นเครื่องมืออุปกรณ์ที่เชื่อมต่อกับอินเตอร์เนตก็ทำการเก็บและรวบรวมข้อมูลซึ่งอาจเป็นเรื่องที่เกี่ยวกับพฤติกรรมการใช้งานของลูกค้า ประสิทธิภาพของสินค้า หรือการเรียนรู้ของเครื่องจักรพวกนี้ล้วนทำให้มีข้อมูลขนาดใหญ่
แม้ว่ายุคของข้อมูลขนาดใหญ่ Big Data มาถึงและได้เริ่มต้นแล้ว แต่มันก็ยังเป็นเพียงแต่ช่วงแรกๆ
และระบบระบบคลาวด์คอมพิวติ้งก็ได้ขยายความเป็นไปได้มากขึ้น
คลาวด์มีความสามารถในการในการใช้งานได้อย่างยืดหยุ่นได้
วิธีกำจัดทำ big data
จับตาคามเคลื่อนไหวและเข้าใจแหล่งที่มาของข้อมูล
วางแผนรวบรวมข้อมูล จากแหล่งที่มีอยู
ฝึกหาความสัมพันธ์ของข้อมูล
ตั้วเป้าหมายถึงสิ่งเล็กไว้ก่อน
จำลองข้อมูลขึ้นมา
องค์ประกอบของระบบ Data แบ่งออก เป็น 5 ส่วนด้วยกัน ได้แก่
Storage แหล่งเก็บข้อมูล
Analytics การวิเคราะห์ข้อมูล
Gateway ช่องทางการเชื่อมโยงข้อมูล
Result/Action การใช้ผลการวิเคราะห์ข้อมูล
Data Source แหล่งที่มาของข้อมูล
ลักษณะที่สำคัญของ big data ที่มีคุณภาพสูงควรมีลักษณะพื้นฐานอยู่ 6 ประการ หลัก ๆ (6 Vs) ดังนี้
ปริมาณ (Volume)
ความเร็ว (Velocity)
ความถูกต้อง (Veracity)
ความหลากหลาย (Variety)
คุณค่า (Value)
ความแปรผันได้ (Variability)
ตัวอย่างการนำ big data ไปใช้
สร้างประสบการณ์ ที่ดีให้กับลูกค้า
การคาดการณ์เพื่อการบำรุงรักษาเครื่องจักร
การพัฒนาผลิตภัณฑ์
รูปแบบของข้อมูล big data
Languages: text message, ข้อความที่ถูก tweet, เนื้อหาต่างๆในเว็บไซต์ เป็นต้น
Records: ข้อมูลทางการแพทย์, ข้อมูลผลส�ำรวจ ที่มีขนาดใหญ่, ข้อมูลทางภาษี เป็นต้น
Image & sounds: ภาพถ่าย, วิดีโอ, รูปจาก google street view, ภาพถ่ายทางการแพทย์, ลายมือ, ข้อมูลเสียงที่ถูกบันทึกไว้ เป็นต้น
Sensors: ข้อมูลอุณหภูมิ, accelerometer, ข้อมูลทางภูมิศาสตร์ เป็นต้น
Behavioral data: ข้อมูลเชิงพฤติกรรมการใช้งาน ต่างๆ เช่น server log, พฤติกรรมการคลิกดูข้อมูล, ข้อมูลการ ใช้ ATM เป็นต้น
การจัดการข้อมูลขนาดใหญ่ big data
3.การเข้าถึง จัดการ และจัดเก็บข้อมูลขนาดใหญ่
การวิเคราะห์ข้อมูลขนาดใหญ่
รู้แหล่งที่มาของข้อมูลขนาดใหญ่
ตัดสินใจอย่างชาญฉลาดและใช้ข้อมูลช่วย
กำหนดกลยุทธ์เกี่ยวกับข้อมูลขนาดใหญ่
กระบวนการจาก big data สู่ความสัมพันธ์ของข้อมูล
Processing: การประมวลผล
Analyst: การวิเคราะห์และนำเสนอ
Storage: การรวบรวมข้อมูลมาจัดเก็บ