Giới thiệu tài liệu
Nhận định và phân tích khoa học tiếp thi của tài liệu, nó trình bày chung một số thủ tục quan trọng, chủ yếu là về việc đánh giá và quản lý nguồn hạt dữ liệu, đồng thời giới thiệu các sự phân biệt nhất quán trong lĩnh vực.
Đối tượng sử dụng
Nhà nghiên cứu, sinh viên, người quản lý dự án khoa học tiếp thi và các doanh nghiệp sử dụng khoa học tiếp thi.
Nội dung tóm tắt
Tài liệu này chủ yếu tập trung vào việc giới thiệu các yêu cầu và công cụ cho quản lý, phân tích và xử lý nguồn hạt dữ liệu trong khoa học tiếp thi. Nó đề cập đến việc cần phải có một quy trình đánh giá và kiểm tra nguồn dữ liệu, đặc biệt là cách đánh giá chất lượng và tin cậy của các hạt dữ liệu. Nó cũng mention tới các công cụ như OpenRefine, Excel và SQL để quản lý và xử lý nguồn dữ liệu trong khoa học tiếp thi. Tài liệu này cũng giới thiệu một số sự phân biệt chính quan trọng trong lĩnh vực, như phân biệt giữa các loại dữ liệu không có thẻ, băm (raw data vs. structured data) và các sự phân biệt giữa các loại thủ tục phân tích và xử lý dữ liệu (data cleaning, data pre-processing, data transformation).