Giới thiệu tài liệu
Luận văn này trình bày về việc dự đoán xu hướng nội dung và phân tích hành vi người dùng trên nền tảng YouTube. Mục tiêu là xây dựng một mô hình học máy hiệu quả để dự đoán các video có khả năng trở nên thịnh hành, từ đó hỗ trợ các nhà sáng tạo nội dung và doanh nghiệp trong việc đưa ra các quyết định chiến lược.
Đối tượng sử dụng
Sinh viên, nhà nghiên cứu, nhà sáng tạo nội dung, và các chuyên gia marketing quan tâm đến việc phân tích dữ liệu và dự đoán xu hướng trên YouTube.
Nội dung tóm tắt
Luận văn này tập trung vào việc phân tích hành vi người dùng trên YouTube và xây dựng mô hình dự đoán xu hướng nội dung. Quá trình nghiên cứu bao gồm thu thập và tiền xử lý dữ liệu từ YouTube Data API v3, phân tích dữ liệu khám phá (EDA) để hiểu rõ cấu trúc và đặc điểm của dữ liệu, áp dụng các kỹ thuật học máy như XGBoost và Random Forest để xây dựng mô hình dự đoán, và đánh giá hiệu quả của mô hình bằng các chỉ số như accuracy, precision, recall và F1-score. Đề tài cũng đề cập đến các phương pháp xử lý dữ liệu mất cân bằng như SMOTE và Tomek Links để cải thiện độ chính xác của mô hình. Kết quả nghiên cứu cho thấy mô hình XGBoost có hiệu quả tốt trong việc dự đoán xu hướng nội dung trên YouTube, tuy nhiên vẫn còn nhiều cơ hội để cải thiện và mở rộng phạm vi ứng dụng.