Kho dữ liệu dùng chung

Kho dữ liệu dùng chung thực hiện chức năng lưu trữ dữ liệu từ nhiều nguồn khác nhau. Sau đó, thực hiện quá trình chuẩn hóa, làm sạch và phân tích; cung cấp dữ liệu đảm bảo chất lượng và dữ liệu theo lĩnh vực nhằm hỗ trợ công tác quản lý, khai thác dữ liệu và hỗ trợ ra quyết định

 

 

Chức năng chính

 

Kết nối và trích xuất dữ liệu

Thông qua 2 hình thức batch và streaming rút trích các dữ liệu từ các nguồn

Làm sạch và biến đổi dữ liệu

Kiểm tra sự trùng lắp, xung đột của dữ liệu trong một nguồn hoặc nhiều nguồn

Quản trị dữ liệu

Giám sát, kiểm soát quản lý dữ liệu, quản lý chất lượng, quản lý quy trình kế hoạch thực thi dữ liệu

Chuẩn hóa và tích hợp dữ liệu

Kiểm tra chất lượng dữ liệu dựa vào các ràng buộc và quy tắc cho từng loại dữ liệu

Điều chỉnh dữ liệu chưa đạt chuẩn

Xem xét đánh giá dữ liệu để quyết định điều chỉnh hay loại bỏ dữ liệu

Khai thác dữ liệu

Dữ liệu sau phân tích sẽ được chia sẻ hoặc trực quan hoá bằng các biểu đồ