Please enable JavaScript.
Coggle requires JavaScript to display documents.
Semantic tagging with Deep Residual Netwworks (ResNet) (sem-tagging (gán…
Semantic tagging with Deep Residual Netwworks (ResNet)
sem-tagging
gán các loại lớp ngữ nghĩa cho các đơn vị có nghĩa nhỏ nhất (hình vị, từ, dấu chấm câu, từ đa ngữ) trong câu.
Theo các phương pháp truyền thống, các thông tin thu thập được không đủ để phân tích ngữ nghĩa từ vựng
Penn TreeBank (PTB): gán nhãn từ loại (POS) thì tốt, nhưng không tốt trong việc gán nhãn ngữ nghĩa (không thể phân biệt ngữ nghĩa cần thiết)
data
Groningen Meaning Bank (GMB)
ngữ liệu các đoạn văn bản tiếng Anh (1.4 triệu từ)
được gán nhãn ngữ nghĩa theo chuẩn bạc (silver) dựa theo luật (rule-based)
Parallel Meaning Bank (PMB)
Khoảng 400 câu tiếng Anh (Đức, Ý, Hà Lan) được gán nhãn ngữ nghĩa chuẩn vàng (gold).
các câu không bị trùng lắp với GMB
các nhãn được sữ dụng trong bài báo (xem bài báo)
Phương thức
Gated Recurrent Unit networks (GRUs) - tầng cao
Biến thể của RNN, giải quyết vấn đề biến mất gradient (trong quá trình tính toán)
bi-directional GRU thực hiện cả 2 forward và backward
có thể được dùng để dự đoán trước và sau ngữ cảnh để dự đoán nhãn.
Thực hiện tốt: POS tagging, named entity tagging, chunking.
CNN hoặc ResNet
Thực nghiệm