Làm thế nào để đánh giá chất lượng dữ liệu?
Trước hậu quả của dữ liệu xấu, các công ty cần hiểu cách đánh giá chất lượng dữ liệu sao cho phù hợp nhất với nhu cầu của họ. Điều này bao gồm việc thiết lập các thước đo và quy trình để đánh giá chất lượng dữ liệu. Theo một bài báo về đánh giá chất lượngdữ liệu từ Pipiano, Lee và Wang, các công ty phải cố gắng để dữ liệu của họ đạt điểm cao trong cả đánh giá khách quan và đánh giá chủ quan.
Để cải thiện chất lượng dữ liệu, tổ chức phải hoàn thành những điều sau:
- Đánh giá các chỉ số chất lượng dữ liệu khách quan và chủ quan
- Phân tích kết quả và xác định lý do đằng sau bất kỳ sự bất hợp lý nào
- Xác định các bước tiếp theo để cải thiện
Đánh giá chất lượng dữ liệu chủ quan
Đánh giá chất lượng dữ liệu chủ quan đo lường cách các bên liên quan, nhà phân tích, người thu thập, v.v., cảm nhận chất lượng của dữ liệu như thế nào. Nếu một bên liên quan được giao nhiệm vụ đưa ra quyết định kinh doanh dựa trên tập dữ liệu mà họ cảm thấy có thể không đầy đủ hoặc không chính xác, nhận thức này cuối cùng sẽ ảnh hưởng đến quyết định mà họ đưa ra.
Đánh giá chất lượng dữ liệu khách quan
Đánh giá chất lượng dữ liệu khách quan là xem xét các phép đo khách quan được ghi lại trong tập dữ liệu, có thể được đánh giá trong bối cảnh của nhiệm vụ đã cho hoặc độc lập từ quan điểm thuần túy dựa trên số liệu. Để thiết lập các thước đo để đánh giá dữ liệu khách quan, các tổ chức có thể sử dụng các nguyên tắc để phát triển KPI phù hợp với nhu cầu của họ, được gọi là các dạng chức năng. Khi thực hiện các đánh giá khách quan, có ba cách để đo lường các dạng chức năng khác nhau về chất lượng. Bao gồm các:
- Tỷ lệ đơn giản
Điều này đo lường tổng số kết quả mong muốn trên tổng số kết quả có thể có. Phạm vi của tỷ lệ này thường từ 0 đến 1, với 1 là kết quả mong muốn nhất.
Tính hoàn chỉnh và nhất quán có thể được đo lường thông qua tỷ lệ này. Tuy nhiên, cả hai thứ nguyên này đều có thể được đo lường theo những cách khác nhau – vì vậy các tổ chức cần xác định các tiêu chí để đo lường điều này một cách tốt nhất.
- Tối thiểu hoặc Tối đa
Biểu mẫu chức năng này được thiết kế để xử lý nhiều biến chất lượng dữ liệu.
Giá trị tối thiểu được thiết kế để trở thành một số thận trọng hơn, trong khi giá trị tối đa là một số tự do hơn. Các biến như mức dữ liệu thích hợp có thể được biểu thị bằng min. Tính kịp thời và khả năng tiếp cận có thể được biểu thị bằng giá thầu CPC
- Bình quân gia quyền
Đây là một phương án thay thế cho min và có thể được sử dụng khi các tổ chức hiểu được giá trị mà mỗi biến đưa vào phương trình.
Sau khi đánh giá các thước đo chất lượng dữ liệu khách quan và chủ quan, tổ chức phải thực hiện các bước tiếp theo để cải tiến quy trình của mình. Các công ty có thể nhận thấy rằng họ đang thiếu tính đầy đủ của dữ liệu hoặc chất lượng dữ liệu. Bài viết sau, chúng tôi sẽ trình bày một số phương pháp hay nhất để vượt qua các thách thức về Dữ liệu sạch và Quản lý chất lượng dữ liệu.
Xem thêm: Làm sạch dữ liệu (Data Cleansing) là gì?
M2Tech luôn mong muốn cung cấp những thông tin, tài liệu quý giá trong con đường chinh phục mọi thử thách của bạn.
Website: https://m2tech.buyit.vn/
Facebook: http://www.facebook.com/m2tech.fb