Giới thiệu tài liệu
Trong kỷ nguyên chuyển đổi số, kiến trúc microservices đã trở thành nền tảng chủ đạo cho phát triển hệ thống phần mềm quy mô lớn, mang lại những lợi ích vượt trội về khả năng mở rộng và linh hoạt. Tuy nhiên, bản chất phân tán của các hệ thống microservices cũng đặt ra thách thức lớn trong việc giám sát, phát hiện và khắc phục lỗi hiệu quả. Các sự cố nhỏ có thể dẫn đến hiệu ứng dây chuyền, gây gián đoạn dịch vụ và ảnh hưởng đến trải nghiệm người dùng. Do đó, việc xây dựng các giải pháp tự động, nhanh chóng để phát hiện và xử lý lỗi, thậm chí có khả năng tự phục hồi, là vô cùng cấp thiết. Đề án này nhằm mục đích giải quyết vấn đề đó, tập trung vào việc tận dụng các dịch vụ đám mây của Amazon Web Services (AWS) để xây dựng một hệ thống phát hiện và khắc phục lỗi hiệu quả, góp phần nâng cao độ tin cậy và ổn định cho các ứng dụng microservices hiện đại.
Đối tượng sử dụng
Sinh viên và nghiên cứu sinh chuyên ngành hệ thống thông tin, kỹ thuật phần mềm, điện toán đám mây; kỹ sư phát triển phần mềm, kiến trúc sư hệ thống, và chuyên gia DevOps làm việc với kiến trúc microservices và nền tảng AWS.
Nội dung tóm tắt
Đề án này đi sâu vào giải pháp phát hiện và khắc phục lỗi trong các hệ thống microservices, một kiến trúc ngày càng phổ biến trong bối cảnh chuyển đổi số. Kiến trúc microservices, mặc dù mang lại khả năng mở rộng và linh hoạt vượt trội, đồng thời tạo ra các thách thức đáng kể trong việc quản lý lỗi do tính chất phân tán của nó. Luận văn trình bày một cái nhìn tổng quan về các loại lỗi phổ biến có thể xảy ra trong môi trường microservices, từ sự cố hạ tầng (như container dừng hoạt động), lỗi ứng dụng (phản hồi HTTP) cho đến các vấn đề hiệu năng (vượt ngưỡng thời gian phản hồi). Trọng tâm của nghiên cứu là phát triển một hệ thống tự động phát hiện lỗi và có khả năng tự phục hồi bằng cách tận dụng các dịch vụ cốt lõi của Amazon Web Services (AWS). Phương pháp tiếp cận bao gồm việc xây dựng một mô hình microservices đơn giản và tích hợp các dịch vụ AWS như CloudWatch để giám sát, SNS để cảnh báo và Lambda để tự động hóa các hành động khắc phục. Để đảm bảo tính khả thi và tiết kiệm chi phí, các kịch bản lỗi được mô phỏng trong môi trường LocalStack, một trình giả lập AWS, cho phép kiểm thử toàn diện pipeline phát hiện và khắc phục lỗi mà không cần tài khoản AWS thực. Giá trị ứng dụng của đề án nằm ở việc cung cấp một giải pháp hiệu quả, linh hoạt và chi phí thấp cho các doanh nghiệp đang vận hành hệ thống microservices trên nền tảng điện toán đám mây. Nó không chỉ giúp nâng cao khả năng phục hồi và độ tin cậy của hệ thống mà còn mở ra hướng nghiên cứu về giám sát thông minh và vận hành tự động, đặt nền móng cho các ứng dụng thực tiễn trong tương lai.