首页 > 御数加油站
在项目中开展数据质量和数据治理工作:实践出真知(连载七)
发布时间:2017-09-23 15:30:30

在系统生命周期嵌入数据治理任务

 

                                 表6-SDLC阶段:构建与测试

构建和测试阶段

团队活动

数据治理和管理活动

数据质量和准备活动

构建产品特色

支持开发人员和分析人员研究有关数据含义和正确使用数据方面的问题。

准备数据实施解决方案并根据需求和设计进行调整;

实施业务流程改进以防止数据质量问题。

细化需求和设计

关于需求和设计的调整,见表4和表5。

关于需求和设计的调整,见表4和表5。

执行问题跟踪和解决

确保推荐的问题解决方案与定义、规则等保持一致,并且不能以损害数据质量的方式解决;

检查问题以解决根本原因(最好是在当前的构建周期中)。

识别数据质量问题的根源并提出解决方案;

记录问题结果,尤其是解决结果对数据质量的影响,需要包括在培训或交流中。

执行测试

将用户界面和报表中的数据元素与术语表定义的内容保持一致;

确保测试可用性,验证数据质量的设计工作是否可以被通过;

支持测试人员研究有关数据的含义和正确使用的问题。

在配置之前,检查数据,并在试验荷载;

在测试结果和规范之间记录任何增量,包括定义和规则;

在依赖于各种测试类型的数据的依赖项之间创建团队间的反馈循环;

帮助分析测试结果并提供对测试过程中发现的问题的解决方案的反馈。

                                   表7-SDLC 阶段:部署

部署阶段团队活动

数据治理和管理活动

数据质量和准备活动

将解决方案移动到生产环境并使其稳定

协调沟通和解决部署过程中发现的数据问题;

更新数据产品和文档,以反映不同版本中的更改过程。

参与每个部署计划;

识别和研究在部署和稳定过程中发现的问题;

实施对数据质量的持续监控,利用项目期间进行的数据质量评估和测试。

                                     表8-SDLC 阶段:产品支持

产品支持阶段团队活动

数据治理和管理活动

数据质量和准备活动

监控系统健康,支持用户维护,并增强迭代

根据需求对数据质量检查进行先后次序的排序,确保对采取的行动结果负责;

重复适用SDLC活动,从表2-7保持和提高数据质量。

根据需要持续查找和推荐其它自动化数据质量检查;

执行日常数据质量评估;

研究、分析根本原因,提出解决数据质量问题的方法;

重复适用SDLC活动,从表2-7保持和提高数据质量。

 

虽然在SDLC阶段看起来像一个传统“瀑布”的方法,所有活动步骤,任务是在一个单一的顺序完成,大多数数据质量管理活动在本质上是迭代的。完成项目中的数据准备及其它数据相关工作,往往需要根据数据主要特征提前建立生命周期。我们认为这种连续的迭代需求是在瀑布或连续型项目中处理数据质量的一个原因。关于迭代的更多讨论将在之后进行。现在记住,平行活动可以在一个单一的项目,在暴露数据质量问题时,常常需要剥离数据准备活动。在本报告后面,我们将提供一个在敏捷开发项目中如何这些活动映射到一个不同SDLC的方法。

如果你的第一反应是在回顾活动,“我们没有时间!”请回顾此前的报告。记住,包括这些在整个SDLC的活动,以及应用这些学科作为所有项目工作的一部分,将帮助你保持工作计划,增加项目成功的机会,并降低了业务中断的风险。

数据准备迭代

那些习惯于以非常连续的方式思考和跟踪项目的人可能会发现,数据质量和治理活动项目启动初期会令人有些不安,即使当所有的需求都不知道,也要学习连续性的调整更多信息,这是一种非常有效的策略。如果计划好、执行好的话,您可以根据业务和早期项目目标,在项目启动时立即开始数据质量评估,当你发现问题时,你可以把它们作为自己小项目上的SDLCs。你必须与原来的项目,如图1所示,图中所示场景中的数据问题和依赖关系是早期发现与解决问题,使工作顺利进行,避免计划中断,给出一定时间来应对将出现的海量数据质量问题。有些在部署前几个月就很容易修复。不幸的是,这些问题比较普遍,但后来才发现,最糟糕的情况是当您在功能测试中发现数据质量问题时,这会对发布的质量和项目计划造成风险。在某些情况下,在投入生产前的短时间内,这些问题就变成了严重的紧急情况。

例如,在项目开始的早期阶段,公司的ERP项目将“产品”作为一个重要的主题区域。项目数据团队和制造业务单位启动“好管家”,在完成数据准备性工作的基础上,已了解相关业务需求和数据质量问题,他们发现未使用的数据很多,这些数据将不会迁移到新的系统,从而减少了提取测试数据的数据量。在项目今后的时间里,他们开始纠正已知的数据精度问题,例如,度量单位或项目描述,从而反映实际产品需要,由于项目团队指导或要求优先解决这些类型的问题,所以很多人在项目团队需要数据的时候得到了帮助。他们根据实际数据源和分析新需求,在项目早期到中期继续进行数据准备工作,这减少了在测试过程中发现问题的数量,让他们的团队有时间迅速处理其它问题。在某些情况下,可以直接去现场改进和解决问题。 

联系我们
地址:北京市海淀区双清路学研大厦B座807室
邮箱:
info@dgworkshop.com.cn
微信号:DGWorkshop_CN
关注我们
Copyright © 2016 御数坊(北京)科技咨询有限公司