13 trang
43 lượt xem
0
43
Mô hình chú ý ngữ cảnh đa tầm nhìn cải tiến cho bài toán trả lời câu hỏi dựa trên hình ảnh bằng tiếng Việt
Bài viết nghiên cứu mô hình chú ý ngữ cảnh đa tầm nhìn cải tiến cho ViVQA, tăng độ chính xác lên 62,41%. Sử dụng Fusion Based on Attention Mechanism.
kimphuong1001