Please enable JavaScript.

Coggle requires JavaScript to display documents.

Data Science Final - Coggle Diagram

- - - - ปัญหาการถดถอยที่มีตัวแปรอิสระเพียงตัวแปร
    - - ปัญหาการถดถอยที่มีตัวแปรอิสระมากกว่า 1 ตัว
  - - - เป็นตัวแบบที่อยู่ในรูปสมการเชิงเส้นใน
        พจน์พารามิเตอร์
    - - เป็นตัวแบบที่อยู่ในรูปสมการที่
        ไม่ใช่ฟังก์ชันเชิงเส้นของพารามิเตอร
- - - - Confidentiality
        
        การสร้างความเชื่อมั่น และการรักษาความลับของข้อมูล
      - Integrity of data
        
        ความมั่นคงของข้อมูล (จะสมบูรณ์เมื่อมีข้อมูลที่มากขึ้น)
      - Availability of data
        
        ความมั่นคงของข้อมูล (จะสมบูรณ์เมื่อมีข้อมูลที่มากขึ้น)
  - - - ลักษณะการดำเนินการด้วยมนุษย์
        โดยปกติใช้สามัญสำนึก (Sense) ในการจัดการ
    - - ลักษณะการดำเนินการตามคำนิยม
        เช่น ทุกๆ 30 ชุดข้อมูลให้จัดเป็นหนึ่งกลุ่ม
    - - ลักษณะการแบ่งข้อมูลให้มีจำนวนเท่าๆ กัน
        เช่น แบ่งกลุ่มนิสิตในห้องเรียน จำนวน 5 กลุ่ม
    - - ลักษณะการแบ่งข้อมูลตามหลักการคณิตศาสตร์
  - - - คุณลักษณะต่างๆ ของข้อมูล ซึ่งเมื่อข้อมูลใดๆ ตกลงมาที่โหนด จะใช้ คุณลักษณะนี้เป็นตัวตัดสินใจว่าข้อมูลจะไปในทิศทางใด “โดยโหนดภายในที่เป็นจุดเริ่มต้นของต้นไม้ เรียกว่า โหนดราก (Root Node)”
    - - เป็นค่าของคุณลักษณะในโนดภายในที่แตกกิ่งนี้ ออกมา ซึ่งโหนดภายในจะแตกกิ่งเป็นจำนวน เท่ากับจำนวนค่าของคุณลักษณะในโหนดภายในนั้น
    - - คือกลุ่มต่างๆ ซึ่งเป็นผลลัพธ์ในการจำแนกประเภทข้อมูล
  - - - เมื่อทุกข้อมูลใน node นั้นเป็น Class เดียวกัน
      - เมื่อทุกข้อมูลใน node นั้นมีค่าของ Attribute เหมือนกัน
- - - - ความน่าจะเป็นของข้อมูลที่มี Attribute เป็น A อยู่ใน Class B
    - - ความน่าจะเป็นของ Training Data ที่อยู่ใน Class B และมี Attribute เป็น A
    - - P(A) ความน่าจะเป็นของ Class A, P(B) ความน่าจะเป็นของ Class B
- - - - ขั้นตอนวิธีเพื่อนบ้านที่ใกล้ที่สุด (K-nearest neighbor approach - KNN) จะคำนวณความคล้ายคลึงจากการวัดระยะความห่าง
      - วิธีการสัดค่าน้ำหนักการถดถอย (Locally weighted regression) โดยการพยายามคาดเดาจากการหาจุดตัดเพื่อวัดค่าจุดข้างเคียง
- - - - ผลเฉลยมากกว่า 2 คลาส
        (Multi-Class Classification) เช่น Setosa/Versicolor/Virginica
    - - True Positive (TP)
        
        Predict : True , Actual : True
      - True Negative (TN)
        
        Predict : False , Actual : False
      - False Positive (FP)
        
        Predict : True , Actual : False
      - False Negative (FN)
        
        Predict : False , Actual : True
    - - Precision
        
        การวัดความแม่นยำของข้อมูล โดยพิจารณาแยกทีละคลาส
      - Recall
        
        การวัดความถูกต้องของ Model โดยพิจารณาแยกทีละคลาส
      - F1-Score
        
        ค่าน้ำหนักเฉลี่ยของ Recall, Precision
      - Accuracy
        
        การวัดความถูกต้องของ Model โดยพิจารณารวมทุกคลาส