Giới thiệu tài liệu
Trong kỷ nguyên chuyển đổi số, kiến trúc microservices đã trở thành tiêu chuẩn cho các hệ thống phần mềm quy mô lớn, mang lại ưu điểm về khả năng mở rộng và linh hoạt. Tuy nhiên, sự phân tán của các dịch vụ cũng đặt ra thách thức lớn trong việc phát hiện lỗi và khắc phục lỗi kịp thời. Các sự cố như gián đoạn hạ tầng, lỗi phản hồi HTTP hay timeout, nếu không được xử lý nhanh chóng, có thể gây mất ổn định nghiêm trọng cho toàn bộ hệ thống. Do đó, việc xây dựng một giải pháp hiệu quả, có khả năng tự động giám sát, phát hiện và phản ứng trước các lỗi này, đặc biệt trong môi trường điện toán đám mây như AWS, là vô cùng cần thiết để đảm bảo tính sẵn sàng và hiệu suất liên tục của ứng dụng.
Đối tượng sử dụng
Các kiến trúc sư phần mềm, kỹ sư DevOps, kỹ sư đám mây, quản trị viên hệ thống, và sinh viên sau đại học chuyên ngành Công nghệ thông tin hoặc Khoa học máy tính, quan tâm đến việc thiết kế và triển khai hệ thống microservices ổn định trên nền tảng AWS.
Nội dung tóm tắt
Đồ án này tập trung vào giải quyết bài toán phát hiện và khắc phục lỗi trong hệ thống microservices, một thách thức lớn trong bối cảnh kiến trúc phân tán hiện đại. Nghiên cứu đề xuất một giải pháp toàn diện sử dụng các dịch vụ mạnh mẽ của Amazon Web Services (AWS) như SNS (Simple Notification Service) và SQS (Simple Queue Service) để xây dựng một pipeline cảnh báo và xử lý lỗi tự động. Cụ thể, hệ thống được thiết kế để phát hiện ba loại lỗi phổ biến: dịch vụ ngừng hoạt động (container stop), lỗi phản hồi phía ứng dụng (Application-level HTTP error) và lỗi vượt ngưỡng thời gian phản hồi (timeout). Phương pháp nghiên cứu bao gồm việc khảo sát lý thuyết, xây dựng mô hình, và triển khai mô phỏng thực tế trong môi trường LocalStack nhằm kiểm chứng hiệu quả. Các kết quả mô phỏng cho thấy khả năng phát hiện lỗi chính xác, cảnh báo kịp thời và tự động thực hiện các hành động khắc phục, như khởi động lại container thông qua các chức năng Lambda. Giải pháp này hướng tới tính đơn giản, dễ triển khai, chi phí thấp, nâng cao độ tin cậy và khả năng tự phục hồi cho các hệ thống microservices, đồng thời cung cấp một khuôn khổ thực tiễn cho các doanh nghiệp trong việc vận hành hiệu quả môi trường đám mây.