数据质量管理:6个维度,50个检查项

数据质量管理:6个维度,50个检查项_第1页
数据质量管理:6个维度,50个检查项_第2页
数据质量管理:6个维度,50个检查项_第3页
数据质量管理:6个维度,50个检查项大数据时代,数据资产及其价值利用能力逐渐成为构成企业核心竞争力的关键要素;然而,大数据应用必须建立在质量可靠的数据之上才有意义,建立在低质量甚至错误数据之上的应用有可能与其初心南辕北辙、背道而驰。因此,数据质量正是企业应用数据的瓶颈,高质量的数据可以决定数据应用的上限,而低质量的数据则必然拉低数据应用的下限。01.数据质量定义数据质量的高低代表了该数据满足数据消费者期望的程度,这种程度基于他们对数据的使用预期。数据质量必须是可测量的,把测量的结果转化为可以理解的和可重复的数字,使我们能够在不同对象之间和跨越不同时间进行比较。数据质量管理是通过计划、实施和控制活动,运用质量管理技术度量、评估、改进和保证数据的恰当使用。02.数据质量维度1、准确性:数据不正确或描述对象过期2、合规性:数据是否以非标准格式存储3、完备性:数据不存在4、及时性:关键数据是否能够及时传递到目标位置5、一致性:数据冲突6、重复性:记录了重复数据03.数据质量分析数据质量分析的主要任务就是检查数据中是否存在脏数据,脏数据一般是指不符合要求以及不能直接进行相关分析的数据。脏数据包括以下内容:1、缺省值2、异常值3、不一致的值4、重复数据以及含有特殊符号(如#、¥、*)的数据我们已经知道了脏数据有4个方面的内容,接下来我们逐一来看这些数据的产生原因,影响以及解决办法。第一、缺省值分析产生原因:1、有些信息暂时无法获取,或者获取信息的代价太大2、有些信息是被遗漏的,人为或者信息采集机器故障3、属性值不存在,比如一个未婚者配偶的姓名、一个儿童的固定收入影响:1、会丢失大量的有用信息2、数据额挖掘模型表现出的不确定性更加显著,模型中蕴含的规律更加难以把握3、包含空值的数据回事建模过程陷入混乱,导致不可靠输出解决办法:通过简单的统计分析,可以得到含有缺失值的属性个数,以及每个属性的未缺失数、缺失数和缺失率。删除含有缺失值的记录、对可能值进行插补和不处理三种情况。第二、异常值分析产生原因:业务系统检查不充分,导致异常数据输入数据库影响:不对异常值进行处理会导致整个分析过程的结果出现很大偏差解决办法:可以先对变量做一个描述性统计,进而查看哪些数据是不合理的。最常用的统计量是最大值和最小值,用力啊判断这个变量是否超出了合理的范围。如果数据是符合正态分布,在原则下,异常值被定义为一组测定值中与平均值的偏差超...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

Q:已扫码付款购买某文档,但购买成功后没有显示下载入口?

A:建议您微信注册登录后购买,不要再次付款。出现该问题的概率很低,联系客服会尽快解决。

Q:如何查询已购买的文档和支付明细?

A:在您的“个人中心-我的订单”里,您可以查看到自己的文档购买记录。

Q:购买后如何下载?

A:在您的“我的订单”里,您可以下载购买的文档到本地。

Q:文档下载后打不开?

A:推荐使用Edge、Chrome内核浏览器下载。下载成功后,使用较高版本 office 或 wps 打开文档。如果文档扩展名不符,修改文档扩展名即可解决。

Q:下载后文档与页面展示有差异?

A:文档的总页数、文档格式和文档大小以系統显示为准,发生争议时,平台客服以系统显示作为判断依据。

Q:文档购买后可以申请退款吗?

A:所有收费文档都可以先部分预览再购买,且平台自身不编辑或修改文档内容,也不对该等内容的真实性、有效性负责。请您谨慎选择所需内容后支付。除因文档自身质量问题外(如:文档出现空白、乱码、内容缺失或下载后内容不一致、无法正常显示、损坏无法打开等情形),付费文档不予退换。

Q: 购买文档后如何咨询客服?

A: 首页点击页面右下角【在线客服】(周一至周五9点-17点),我们将安排专人为您处理。

医管老道
实名认证
内容提供者

给大家分享医院管理中包括医务、护理、院感、运营、绩效、财务和信息等方便的知识和经验。希望大家喜欢!

确认删除?
回到顶部
在线客服
己有书馆