Khai thác văn bản là môn học nghiên cứu các phương pháp và công cụ để phân tích, xử lý và trích xuất thông tin có giá trị từ dữ liệu văn bản. Sinh viên được trang bị kiến thức về tiền xử lý văn bản, biểu diễn dữ liệu văn bản, phân loại, phân cụm, khai thác chủ đề và phân tích cảm xúc. Đây là lĩnh vực kết hợp giữa khai phá dữ liệu và xử lý ngôn ngữ tự nhiên, ứng dụng rộng rãi trong tìm kiếm thông tin, phân tích mạng xã hội, chatbot và hệ thống gợi ý.