Phát hiện motif trên time series dựa vào giải thuật của mueen

Dữ liệu chuỗi thời gian được ứng dụng rất phổ biến ở rất nhiều lĩnh vực như khoa học kỹ thuật, kinh tế tài chính, môi trường trong thời kỳ 4.0. Trong những ứng dụng này, việc phát hiện motif hay còn gọi là tìm mẫu lặp trong dữ liệu chuỗi thời gian là công việc cần thiết để phục vụ các công việc cao hơn như gom cụm, phân lớp, khai phá luật kết hợp v.v... Thuật toán phát hiện motif thực ra nó là sự cải tiến của các thuật toán tìm kiếm chuỗi con truy vấn xem có xuất hiện trong dữ liệu chuỗi thời gian? Có rất nhiều thuật toán phát hiện motif được đề xuất, nhưng mô hình của những thuật toán tối ưu gồm các thuật toán sau MOEN [2], MASS (Mueen’s Algorithm for Similarity Search) [4], HIME (Hierarchical based Motif Enumeration) [3] dựa vào các tiền đề chung là phương pháp biến đổi về miền tần số (FFT – Fast Fourier Tranform) và thu giảm số chiều và các cấu trúc chỉ mục không gian đa chiều. Trong luận văn này điểm qua các nghiên cứu mới đây sử dụng các phương pháp rút trích đặc trưng phục vụ cho thuật toán phát hiện motif trên dữ liệu chuỗi thời gian lớn bằng thực nghiệm trên tất cả các bộ dữ liệu mà các tác giả cung cấp để kiểm tra tính đúng đắn của tất cà các thuật toán trên.
Bạn đang xem trang mẫu tài liệu này.