💻Big Data💻

ความหมายของ Big Data

องค์ประกอบสำคัญของ Big Data

ลักษณะที่สำคัญของ Big Data

รูปแบบของข้อมูล Big Data


Big Data คือ ข้อมูลจำนวนมากมหาศาลของบริษัททุกเรื่อง ทุกแง่มุม ทุกรูปแบบที่คุณพอจะนึกออก ซึ่งอาจเป็นข้อมูลที่มีโครงสร้างชัดเจน (Structured Data) เช่น ข้อมูลที่เก็บอยู่ในตารางข้อมูลต่างๆ หรืออาจเป็นข้อมูลกึ่งมีโครงสร้าง (Semi-Structured Data) หรือแม้กระทั่งข้อมูลที่ไม่มีโครงสร้าง

1.ข้อมูลเชิงพฤติกรรม

2.ข้อมูลภาพและเสียง

3.ข้อมูลข้อความ

4.ข้อมูลที่ถูกบันทึกไว้

5.ข้อมูลเซนเซอร์

1. Data Source แหล่งที่มาของข้อมูลซึ่งถือได้ว่า เป็นต้นน้ำ เป็นแหล่งกำเนิดของข้อมูล อาจจะเป็นระบบ โปรแกรม หรือจะเป็นมนุษย์เรา ที่สร้างให้เกิดข้อมูลขึ้นมา ทั้งนี้ เมื่อได้ชื่อว่าเป็น Big Data แล้ว ข้อมูลต่างๆ มักจะมาจากแหล่งข้อมูลที่หลากหลาย นำพามาซึ่งความยากลำบากในการจัดการโครงสร้าง หรือจัดเตรียมให้ข้อมูล
นำมารวมกันนั้น มีความพร้อมใช้ต่อไป

2. Gateway ช่องทางการเชื่อมโยงข้อมูล
การเชื่อมโยงข้อมูล เป็นส่วนที่สำคัญมาก และเป็นปัญหาใหญ่ในการทำ Big Data Project ต้องอาศัยทักษะของ Data Engineer ทั้งการเขียนโปรแกรมเอง และใช้เครื่องมือที่มีอยู่มากมาย ทั้งนี้การจะออกแบบช่องทางการเชื่อมโยงข้อมูลได้อย่างสมบูรณ์แบบ จำเป็นต้องทราบก่อนว่า จะนำข้อมูลใดไปทำอะไรต่อบ้าง มิเช่นนั้น การสร้างช่องทางการเชื่อมที่ไม่มีเป้าหมาย ก็อาจเป็นการเสียเวลาโดยเปล่าประโยชน์

3. Storage แหล่งเก็บข้อมูล
แหล่งเก็บนี้ ไม่ใช่แค่การเก็บข้อมูลจากแหล่งข้อมูล แต่เป็นการเก็บข้อมูลจากแหล่งข้อมูลหลายๆ แหล่ง เอามาไว้เพื่อรอการใช้งาน ซึ่งอาจจะเป็นที่พักข้อมูลให้พร้อมใช้ หรือจะเป็นแหล่งเก็บข้อมูลในอดีตก็เป็นได้

4. Analytics การวิเคราะห์ข้อมูล
ส่วนนี้เป็นหน้าที่หลักของ Data Scientist ซึ่งแบ่งงานออกเป็น 2 ลักษณะ คือ การวิเคราะห์เบื้องต้น โดยการใช้วิธีทางสถิติ หรือจะเป็นการวิเคราะห์เชิงลึกโดยการสร้าง Model แบบต่างๆ รวมไปถึงการใช้ Machine Learning เพื่อให้ได้ผลลัพธ์เฉพาะจงเจาะในแต่ละปัญหา และแต่ละชุดข้อมูล

5. Result/Action การใช้ผลการวิเคราะห์ข้อมูล
ผลลัพธ์ที่ได้จากการวิเคราะห์สามารถนำไปใช้งานได้ 2 รูปแบบ คือ ออกเป็นรายงาน เพื่อให้ Data Analyst นำผลลัพธ์ที่ได้ไปใช้กับงานทางธุรกิจต่อไป หรือจะเป็นการนำไปกระทำเลยโดยที่ไม่ต้องมี “มนุษย์” คอยตรวจสอบ ซึ่งจำเป็นต้องมีการเขียนโปรแกรมเพิ่ม เพื่อให้มีการกระทำออกไป ที่เรียกว่า Artificial Intelligence (AI)

click to edit

4.Veracity (ความไม่ชัดเจน)คือข้อมูลที่ยังไม่ผ่านการดำเนินการให้อยู่ในรูปแบบของข้อมูลที่เป็นประโยชน์ต่อองค์กร

3.Variety (ความหลากหลาย)ข้อมูลมีความหลากหลาย สามารถเป็นได้ทั้งที่มีโครงสร้าง และข้อมูลที่ไม่สามารถจับรูปแบบได้

2.Velocity (ความเร็ว)ข้อมูลมีความเปลี่ยนแปลงอย่างรวดเร็ว มีการส่งผ่านข้อมูลแบบ Streaming ทำให้การวิเคราะห์ข้อมูลแบบ manual มีข้อจำกัด

1.Volume (ปริมาณ) คือขนาดของข้อมูลที่รวบรวมมาได้ มีปริมาณข้อมูลมาก ซึ่งสามารถเป็นได้ทั้ง Online และ Offline

Big Data นั้นจะประกอบไปด้วยคุณลักษณะ 4 อย่าง ดังนี้