Please enable JavaScript.
Coggle requires JavaScript to display documents.
Statistical MT (Tổng quan (Các bước thực hiện (Chuẩn bị corpus…
Statistical MT
Tổng quan
Khái niệm
Mỗi câu trong ngôn ngữ đích là bản dịch có xác suất trong ngôn ngữ nguồn. Bản dịch tốt nhất là câu có xác suất cao nhất.
Vấn đề chính
Tính xác suất của bản dịch (ngôn ngữ đích), và tính hiệu quả trong việc tìm kiếm câu có xác suất cao nhất.
Xác suất
Xác suất mỗi cặp câu (S,T) là P(T|S), được hiểu là xác suất của 1 câu T trong ngôn ngữ đích được dịch bởi 1 câu S trong ngôn ngữ nguồn.
vd
Cặp câu "Lematin je me brosse les dents / President Lincoln was a good lawyer" có xác suất P(T|S) nhỏ.
Cặp câu "Le president Lincoln btait un bon avocat | President Lincoln was a good lawyer" có xác suất lớn.
-
Các bước thực hiện
-
Chuẩn bị corpus
-
-
-
Cleaning
Loại bỏ những câu dài, câu rỗng hoặc những câu sai lệch
-
-
-
-