
1
MỞ ĐẦU
Tính cấp thiết của luận án
Rút gọn thuộc tính và sinh luật quyết định là hai bài toán quan
trọng trong quá trình khám phá tri thức từ dữ liệu. Rút gọn thuộc
tính của bảng quyết định là quá trình lựa chọn tập con nhỏ nhất của
tập thuộc tính điều kiện, loại bỏ các thuộc tính dư thừa mà bảo toàn
thông tin phân lớp của bảng quyết định, gọi là tập rút gọn (reduct).
Kết quả rút gọn thuộc tính ảnh hưởng trực tiếp đến hiệu quả thực
hiện các nhiệm vụ khai phá: Gia tăng tốc độ, cải thiện chất lượng,
tính dễ hiểu của các kết quả thu được. Sinh luật quyết định là bước
tiếp theo của rút gọn thuộc tính trong khai phá dữ liệu nhằm đánh
giá chất lượng phân lớp của dữ liệu thông qua độ hỗ trợ của tập luật
quyết định.
Lý thuyết tập thô mờ (Fuzzy rough set) do Dubois, D., và
Prade, H., đề xuất là sự kết hợp của lý thuyết tập thô và lý thuyết
tập mờ nhằm xấp xỉ các tập mờ dựa trên một quan hệ tương đương
mờ (fuzzy equivalent relation) được xác định trên miền giá trị thuộc
tính. Theo lý thuyết tập thô mờ, độ tương đương mờ của hai đối
tượng là một giá trị nằm trong đoạn [0,1] cho thấy tính gần nhau,
hay khả năng phân biệt giữa hai đối tượng. Do đó, quan hệ tương
đương mờ bảo toàn sự khác nhau giữa các đối tượng và các phương
pháp rút gọn thuộc tính theo tiếp cận tập thô mờ có tiềm năng trong
việc bảo toàn độ chính xác phân lớp sau khi thực hiện các phương
pháp rút gọn thuộc tính.
Chủ đề nghiên cứu về rút gọn thuộc tính và sinh luật quyết
định theo tiếp cận tập thô mờ đã thu hút sự quan tâm của các nhà
nghiên cứu trong mấy năm gần đây. Luận án tập trung nghiên cứu
trọng tâm vào hai bài toán: