Please enable JavaScript.
Coggle requires JavaScript to display documents.
เนื่องจาก Image Recognition นี้มีแนวโน้มว่าจะกลายเป็นกรณีการใช้งานแรกๆ…
เนื่องจาก Image Recognition นี้มีแนวโน้มว่าจะกลายเป็นกรณีการใช้งานแรกๆ ของหลายๆ ธุรกิจในการนำ 3 เทคโนโลยีดังกล่าวมาประยุกต์ใช้ ด้วยการนำข้อมูลที่สามารถเก็บรวบรวมได้ง่ายที่สุดอย่างภาพถ่ายหรือภาพจากกล้องวงจรปิด ทิศทางของเทคโนโลยีกลุ่มนี้นับวันจะยิ่งง่ายขึ้นเรื่อยๆ เพื่อให้ผู้เชี่ยวชาญในอาชีพแขนงต่างๆ สามารถนำเครื่องมือและข้อมูลที่มีอยู่ไปสร้าง AI ที่ตอบโจทย์ความต้องการได้ด้วยตัวเองมากขึ้น ดังนั้นหากใครเชื่อว่า AI เป็นเรื่องของคนสาย IT เท่านั้นก็ควรรีบเปลี่ยนความคิดเสียใหม่ และเริ่มต้นศึกษาเพื่อคว้าโอกาสในอนาคตกันได้แล้ว
- Artificial Intelligence (AI), Machine Learning(ML)
Deep Learning (DL)
-
-
-
2.Image Recognition
สมองของเราทำให้วิสัยทัศน์ดูเหมือนง่าย ไม่ต้องใช้ความพยายามใด ๆ ที่มนุษย์จะต้องแยกแยะระหว่างสิงโตและจากัวร์อ่านเครื่องหมายหรือจดจำใบหน้าของมนุษย์ แต่นี่เป็นปัญหาที่ยากมากในการแก้ปัญหาด้วยคอมพิวเตอร์: ดูเหมือนง่ายเพราะสมองของเราเข้าใจภาพได้ดีอย่างไม่น่าเชื่อ
ในช่วงไม่กี่ปีที่ผ่านมาด้านการเรียนรู้เกี่ยวกับเครื่องจักรได้ประสบความสำเร็จอย่างมากในการแก้ไขปัญหาที่ยากลำบากเหล่านี้ โดยเฉพาะอย่างยิ่งเราพบว่าแบบจำลองที่เรียกว่า เครือข่ายประสาทเชิงเส้นเอ็น ลึกสามารถบรรลุสมรรถนะที่เหมาะสมในงานการรับรู้ภาพที่ยาก - จับคู่หรือเกินประสิทธิภาพของมนุษย์ในบางโดเมน
นักวิจัยได้แสดงให้เห็นถึงความคืบหน้าในการมองเห็นคอมพิวเตอร์อย่างต่อเนื่องโดยการตรวจสอบความถูกต้องของการทำงานกับ ImageNet ซึ่งเป็นเกณฑ์มาตรฐานทางวิชาการสำหรับการมองเห็นคอมพิวเตอร์ โมเดลต่อเนื่องยังคงแสดงการปรับปรุงทุกครั้งที่บรรลุผลที่ทันสมัย: QuocNet , AlexNet , Inception (GoogLeNet) , BN-Inception-v2 นักวิจัยทั้งภายในและภายนอกจาก Google ได้เผยแพร่เอกสารที่อธิบายถึงโมเดลเหล่านี้ทั้งหมด แต่ผลลัพธ์ก็ยังยากที่จะทำซ้ำ ขณะนี้เรากำลังดำเนินการขั้นตอนต่อไปโดยการปล่อยโค้ดสำหรับเรียกใช้การจดจำภาพในรูปแบบใหม่ล่าสุดของเราคือ Inception-v3
Inception-v3 ได้รับการฝึกอบรมสำหรับ ImageNet Large Visual Recognition Challenge โดยใช้ข้อมูลจาก 2012. นี่เป็นงานมาตรฐานในการมองเห็นด้วยคอมพิวเตอร์ซึ่งโมเดลพยายามที่จะจำแนกภาพทั้งหมดลงใน 1000 คลาส เช่น "Zebra", "Dalmatian" และ "Dishwasher" " ตัวอย่างเช่นนี่คือผลลัพธ์ที่ได้จาก AlexNet ในการ จำแนกภาพบางภาพ:
เมื่อต้องการเปรียบเทียบโมเดลเราจะตรวจสอบว่ารูปแบบนี้ทำนายว่าคำตอบที่ถูกต้องเป็นหนึ่งใน 5 อันดับแรกของพวกเขาที่เรียกว่า "อัตราความผิดพลาดสูงสุด 5 อันดับ" หรือไม่ AlexNet ประสบความสำเร็จด้วยการตั้งค่าอัตราความผิดพลาดสูงสุด 5 อันดับจาก 15.3% ในชุดข้อมูลการตรวจสอบ 2012; Inception (GoogLeNet) มี อัตราการเติบโต 6.67% BN-Inception-v2 ขึ้น 4.9%; Inception-v3 ถึง 3.46%