Please enable JavaScript.
Coggle requires JavaScript to display documents.
INFORMATION
RETRIEVAL, Xử lý hình thái từ, Dựa trên độ tương đồng ngữ…
INFORMATION
RETRIEVAL
1. Các mô hình
căn bản
-
-
Các mô hình
-
Vector
Vài công thức sim (cos, L1, L2)
-
-
Xác suất
-
Làm mịn để tránh xs bằng 0, kết hợp với các pp xấp xỉ
-
-
Các vấn đề trong IR
Lập chỉ mục cho tài liệu
-
-
filter ra các stop word, empty word
-
-
-
Mô hình cải tiến
Language model
n-grams
uni-bi-tri, ước lượng bằng maximum likelihood
-
Nguyên lý
Coi mỗi document là một LM,
ta tính P(q,D) là xác suất q thuộc về LM đó
Latent Semantic
Indexing
Mục tiêu rút gọn, giảm chiều ma trận A = U.S.Vt, bằng cách chọn Sk<<S
-
-
2. Đánh giá
một hệ IR
-
-
-
-
Kho Test corpus
-
-
Cần test collection
Document
Relevant,
thang đánh giá 11 điểm
-
-
-
3. Ứng dụng NLP
vào IR
Concept Search
Định nghĩa
Vấn đề của
keyword search
keyword vs concept
Giải pháp
NL2FL
(natural to formal)
W2P
(word to phrases)
Knowledge
- 4 more items...
-
-
-
-
-
-
-
WordNet
& Ontology
WordNet
-
- Là CSDL tri thức ngữ nghĩa English
- Phân chia từ vựng theo hệ thống cấp bậc
Ontology
- Là Model biểu diễn các khái niệm
- Trong 1 lĩnh vực cụ thể
- Thể hiện mối quan hệ giữa các KN
-
-
-
-
-
-
-
-
-
-
-
-
- Dựa trên độ tương đồng ngữ nghĩa
- Truy vấn trên các dữ liệu phi cấu trúc
-