Quickgen: quick association rules mining in transactional databases

Abstract

Khai thác luật kết hợp (LKH) trong khai phá dữ liệu có vai trò quan trọng trong việc tìm ra các kết hợp hoặc luật xuất hiện đồng thời trong dữ liệu. Bài toán được chia thành hai giai đoạn: thứ nhất, sinh các kết hợp từ dữ liệu thỏa ngưỡng phổ biến minsup; thứ hai, sinh LKH từ tập chứa các kết hợp phổ biến được tìm ở trên và thỏa ngưỡng tin cậy minconf. Phần lớn các nghiên cứu tập trung xác định các kết hợp phổ biến ở giai đoạn thứ nhất. Ngược lại, giai đoạn sinh LKH ít được quan tâm nghiên cứu. Trong nghiên cứu, tác giả trình bày giải pháp rút gọn tập ứng viên dựa vào khái niệm lớp tương đương – giải pháp được đặt tên QuickGen. Phần thực nghiệm, tác giả xây dựng hai kịch bản: (1) so sánh tính hiệu quả của giải pháp trên giai đoạn sinh luật; (2) đánh giá hiệu quả trên toàn bộ quá trình khai thác LKH – QuickGen được dùng ở cả hai giai đoạn. Kết quả cho thấy giải pháp đề xuất mang lại hiệu suất vượt trội.