Giới thiệu tài liệu
Bài thuyết trình này trình bày về dự đoán trễ chuyến bay, một vấn đề quan trọng trong ngành hàng không. Việc dự đoán chính xác sự chậm trễ có thể giúp các hãng hàng không tối ưu hóa hoạt động, giảm thiểu tác động tiêu cực đến hành khách và tăng doanh thu.
Đối tượng sử dụng
Sinh viên và nhà nghiên cứu quan tâm đến khai phá dữ liệu, học máy và ứng dụng của chúng trong ngành hàng không.
Nội dung tóm tắt
Bài thuyết trình này tập trung vào việc xây dựng mô hình dự đoán trễ chuyến bay sử dụng dữ liệu lịch sử chuyến bay và thời tiết từ Hoa Kỳ trong năm 2019. Mục tiêu là tạo ra một mô hình có khả năng dự đoán chính xác khả năng và mức độ trễ chuyến bay, từ đó giúp cải thiện trải nghiệm của hành khách và tối ưu hóa hoạt động của các hãng hàng không. Các phương pháp khai phá dữ liệu và học máy, bao gồm EDA (Phân tích dữ liệu thăm dò), tiền xử lý dữ liệu, lựa chọn đặc trưng và huấn luyện mô hình, đã được áp dụng. Các mô hình CatBoost, XGBoost và LightGBM đã được thử nghiệm và so sánh để đánh giá hiệu suất dự đoán. Kết quả cho thấy mô hình CatBoost đạt được kết quả tốt nhất trong việc dự đoán trễ chuyến bay. Ngoài ra, bài thuyết trình cũng thảo luận về tầm quan trọng của các yếu tố như thời tiết, thời gian trong ngày và hãng hàng không đối với việc dự đoán trễ chuyến bay.