数据质量管理基础 pdf下载
限时特惠
00:00:00
活动结束后恢复原价
纸质书参考价
¥23
电子版限时价
¥5.99
省 18 元
选择版本
内容简介
本篇主要提供数据质量管理基础电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com
内容简介
数据质量是数据管理中极其重要的一个方面。现有数据库系统通常可支持大规模数据的创建、维护、使用。侧重于数据的“量”的管理。但真实世界中的数据通常是“脏”的。常见问题包括数据不一致、重复、不完整或时效性不强。数据库中的问题数据则带来诸多后果,例如:产生误导性或偏向性的分析结果与决策制定,以及效益、信誉以及客户的损失等。因而,数据质量管理可谓当务之急。与传统的数据管理任务不同。数据质量管理在语法和语义方面对数据错误进行检测并修正,以增强数据质量,进而为商业过程增值。
《数据质量管理基础》概述了数据质量的5个核心问题,即数据一致性、数据去重、数据时效性及信息完整性,提出了一个统一的基于数据质量规则的逻辑框架来解决上述问题。
《数据质量管理基础》适合作为研究生教材,也可供数据质量管理领域的研究者与实践者参考。
《数据质量管理基础》概述了数据质量的5个核心问题,即数据一致性、数据去重、数据时效性及信息完整性,提出了一个统一的基于数据质量规则的逻辑框架来解决上述问题。
《数据质量管理基础》适合作为研究生教材,也可供数据质量管理领域的研究者与实践者参考。
前言/序言
数据质量是数据管理中极其重要的一个方面。现有数据库系统通常可支持大规模数据的创建、维护、使用,侧重于数据的“量”的管理。但真实世界中的数据通常是“脏”的,常见问题包括数据不一致、重复、不完整或时效性不强。数据库中的问题数据,则带来诸多后果,例如,产生误导性或偏向性的分析结果与决策制定,以及效益、信誉、客户的损失等。因而,数据质量管理可谓当务之急。与传统数据管理任务不同,数据质量管理在语法和语义方面对数据错误进行检测并修正,以增强数据质量,进而为商业过程增值。
本书概述数据质量的5个核心问题,即数据一致性、数据重复性、数据时效性及信息完整性。我们提出一个统一的基于数据质量规则的逻辑框架来解决上述问题。本书正文由7章组成(重点考虑关系型结构化数据):第1章简介数据质量问题;第2章展开讨论条件依赖理论;第3章阐述发现条件依赖,以及基于发现条件依赖检测数据不一致、修复数据的实践技术;第4章介绍依赖匹配作为数据去重的匹配规则;第5章重温经典的两个信息完整性假定,即封闭世界假定和开放世界假定,并提出和研究相对信息完整性理论;第6章进行数据时效性建模,以便时间戳缺失情况下,在数据库中进行实体新值辨别并基于此返回查询结果;第7章探索数据质量问题之间的交互作用。本书内容同时覆盖重点理论和实践性算法,但并不给出正式论证。参考文献注解中可找到本书中理论与算法的相关论文出处和论证,以及拓展阅读材料。本书适合作为研究生教材,也可供数据质量管理领域的研究者与实践者的参考。为消化本书内容,建议读者熟悉数据质量的相关基础知识,包括数理逻辑、计算复杂度理论、数据库理论等。本书回答数据质量管理的诸多问题,同时也启发细心的读者发现问题。
本书概述数据质量的5个核心问题,即数据一致性、数据重复性、数据时效性及信息完整性。我们提出一个统一的基于数据质量规则的逻辑框架来解决上述问题。本书正文由7章组成(重点考虑关系型结构化数据):第1章简介数据质量问题;第2章展开讨论条件依赖理论;第3章阐述发现条件依赖,以及基于发现条件依赖检测数据不一致、修复数据的实践技术;第4章介绍依赖匹配作为数据去重的匹配规则;第5章重温经典的两个信息完整性假定,即封闭世界假定和开放世界假定,并提出和研究相对信息完整性理论;第6章进行数据时效性建模,以便时间戳缺失情况下,在数据库中进行实体新值辨别并基于此返回查询结果;第7章探索数据质量问题之间的交互作用。本书内容同时覆盖重点理论和实践性算法,但并不给出正式论证。参考文献注解中可找到本书中理论与算法的相关论文出处和论证,以及拓展阅读材料。本书适合作为研究生教材,也可供数据质量管理领域的研究者与实践者的参考。为消化本书内容,建议读者熟悉数据质量的相关基础知识,包括数理逻辑、计算复杂度理论、数据库理论等。本书回答数据质量管理的诸多问题,同时也启发细心的读者发现问题。