首页 > 御数图书馆
【御数之旅-5】企业数据世界论坛结题篇:洞察行业趋势,倾听中国好声音
发布时间:2016-11-04 19:41:56

 

美国东部时间4月1日至4月3日上午,第19届企业数据世界EDW大会在华盛顿11街凯悦(Grand Hyatt)酒店呈现了精彩纷呈的两天半论坛议程。亮点和干货太多,我们却分身乏术、撰稿时间有限,只好合并报道、作为本次“御数之旅”的结题篇。


用数据看议题,洞察焦点和趋势

会议期间,我们一直忙于聆听演讲、更换会场、同行交流。正如第3期所说,当一大波数据大佬来袭的时候,观众的选择极其困难。因此,虽然我们收获了很多,但难免有些只见树叶不见森林,忽略了对行业发展的趋势观察。所以,让我们从具体内容跳出来、从整体上看看这次大会演讲议题的分布,看看有哪些趋势性的洞察。


官方对议题的统计和分析没有发布,下面的分析完全是御数坊根据官方日程安排独立完成,可能会有疏漏,但也基本能为大家展示此次会议的全貌。


这次会议共有演讲178个,官方将演讲主题共分为21类,每一个演讲可能属于多个类,因此各类演讲的数字之和是234。从主题分布来看,不难得到以下关键发现:

1.数据治理与管理制度仍然是企业开展数据工作最为关心的话题。数据与业务、数据与技术、数据与管理,这几方面的协调一致都需要基于企业实际情况去确定组织、职责、制度、流程、标准,而这部分内容也高度依赖于企业文化、人员意识、技能和习惯。御数坊认为,在可预见的未来,数据治理将始终是数据工作的核心关注,数据资产价值的发挥与创造,需要靠数据治理来保障。让我们再来回顾一下美联储的数据治理体系框架。可以看到,美联储谈的是广义的数据治理:将数据战略、治理、各项数据管理能力,统一纳入到治理框架中。



2.数据战略的关注程度前所未有。EDW大会的主办方是DAMA(Data Management Association),源于DBA、数据建模等IT技术工作,逐渐发展为主要关注数据管理,而对于数据在企业发展中的定位、价值创造等战略话题关注不多。一个例证是,在2009年出版的《DAMA数据管理知识体系指南》(DMBOK)中,数据战略的话题只出现过一次,是作为“数据治理”的活动之一进行阐述。御数坊认为,随着最近几年对数据资产价值的重视,继企业发展战略、信息化战略之后,数据战略已经成为企业又一重要的顶层设计,为企业数据工作制定蓝图与演进路线。让我们看看Equifax是怎样谈数据战略的。

首先,在Equifax内部,大家对数据战略还存在不完全一致的理解,这是由于公司目标(以及对数据的依赖和使用方式)的定义不一致。

其次,在Equifax,数据战略的核心焦点是:为获得深度洞察提供支持,从而应对客户当前和未来所面临的各种挑战。其主要功能有三:

  • 支持洞察:从大数据中洞察如何解决客户痛点。

  • 数据创新:主动从数据中发现价值和机会。

  • 数据评估:数据资产是获得数据洞察的基础,持续寻找可创造新价值的新数据资产。



3.大数据的新兴力量与传统数据管理互为补充。从数据中可以看到,如果将NoSQL, Big Data, Hadoop,Data Science等主题合并起来,新兴数据话题的数量已经远超Data Architecture,Data Modeling,Data Integration,Metadata, Master Data, DataQuality等话题。但是,御数坊认为,这并不代表传统数据管理领域已经过时。架构、元数据、主数据、数据集成、数据质量,这几个话题与大数据不是一个维度的主题。大数据的管理同样要围绕这几方面展开。这一点上,我们同意Robert Seiner的观点,不应谈Big Data Governance,而应该谈Data Governance of Big Data。

这里我们引用DAMA计划在2015年出版的DMBOK第二版的知识体系框架,可以看到,新版DMBOK并未将Big Data作为独立章节来体现,而是将大数据的管理融入各个职能中。


4.数据建模与敏捷开发中的数据管理:值得关注却似乎被国内忽视的主题。数据建模的主题在本次大会演讲数量中排名前五,但在国内会议中更倾向讨论系统级架构而非数据建模的细化方法。这次大会上讨论数据建模的内容,更多是围绕新兴数据库的,比如NoSQL对数据建模的影响、文档数据库如何建模、Cassandra如何建模等。企业数据模型直接反映了企业的业务需求和数据需求,是企业数据架构的核心,其重要性怎样强调都不为过。让我们看看EBAY如何看待NoSQL建模对企业数据架构的影响。

企业数据架构是将企业信息资产与核心业务战略协同的主蓝图,对信息产生和消费提供整合视图,是企业集成各方面的框架,在企业各项数据管理工作起到核心作用,如数据质量、数据管理职责、数据安全、数据治理、数据生命周期管理等。



大数据时代有众多NoSQL数据库,覆盖了在线、近线和离线数据存储。



NoSQL对企业数据架构产生的影响在于:基础思维方式的转变,包括获得更敏捷的开发能力,专注于物理模型设计获得更高性能的分布式查询,支持近实时的半结构化、非结构化大数据获取。保持不变的内容包括:基础软件工程实践,Just-In-Time的软件设计和开发方法,业务/数据/流程建模的技术工具。



敏捷开发相信在国内已有广泛实践,但是如何在敏捷开发中考虑数据管理、敏捷开发与元数据、数据质量、数据架构等如何有效结合,从而保障数据的质量?这类话题几乎还没有涉及。也许有人会说,敏捷强调的是快速交付和迭代,数据治理和管理会让开发“不敏捷”。确有其道理,但是应用交付后,数据如何保障?如果不能在开发过程中考虑数据,恐怕再敏捷的开发也可能要推到重来。这方面我们再来看看Robert Seiner的思考。

如何把敏捷开发推销给数据人?



如何把数据治理推销给敏捷开发人员?



数据治理与敏捷开发,可以共存吗?


来自中国参会者的声音

这次EDW大会上有两次中国好声音,首先由DAMA China主席胡本立先生探讨前瞻性半结构化数据模型。下图为胡本立先生在演讲:半结构化模型-广义数据建模缺失的一项工作 The Semi-StructuralModel – A Missing Effort of 'Data Modeling' in ItsBroader Sense。有来自EBAY,SAP等多家知名公司的专家在会上和会后留下交换意见,导致下一个session未能准时开始。



接下来,DAMA China资深会员、房地美首席架构师邓新华博士带来:基于企业逻辑数据模型和SOA架构进行企业数据集成。根据笔者经验,这对于国内众多已经实施了企业级数据模型却未能达到预期效果、对企业数据模型的价值尚存困惑的企业来说,有很好的参考借鉴作用


使用SOA架构+企业逻辑数据模型支撑企业数据集成,显著降低TCO,提高组件复用度,加快产品和服务对市场的响应,实现应用解耦。


基于企业逻辑数据模型实现企业数据机场标准、项目建设快速建模,从而提升数据质量、降低复杂度。


在项目建设过程中加强对数据架构和模型的管控,所有新开发项目必须使用企业数据模型,所有数据集成和移动必须遵从企业数据模型。


此外,部分中国同胞在会议期间安排了小聚,探讨中美数据管理发展、深度沟通工作和参会心得,纷纷表示回国后一定要保持联系,多多交流。下图是来自御数坊、房地美、世界银行、联想的中国参会者合影。


EDW2015大会让来自中国的参会者收获多多,让我们节选几位的感言:

“胡先生好!我们已经顺利回到北京了,非常感谢您邀请我参加这次的国际会议,收获真的是超预期,能亲身感受到世界各地的数据应用情况,能面对面交流,让我受益匪浅,似乎开阔眼界了,再次谢谢您,并期待您的中国行。”

 

——来自金融机构的参会者给胡本立先生发来消息


“…建议多对焦那些成功的实例,特别是大牌公司的企业规模的cases。他们的成功是用失败和教训沉淀而来的。这也正是EDW的宗旨。相信对国内的企业有参考价值。“

 

——来自房地美的邓新华博士为【御数之旅】提供建议


“信息是数据经过甄别和处理后的高级表现,信息比数据更具有业务意义和价值。“DT时代”的说法,并不是说明数据比信息更重要,反之,它说明随着人类各种生活行为被不断数字化而带来的不规则数据的几何量级的增长,由数据到信息的转换更加重要和复杂,现有的成熟的IT技术已经不能适应这种需要。从这个角度说,DT时代是下一代信息技术革命的前夜。“

 

——来自联想的参会者聆听专家讲课发布朋友圈感言

 

结语:御数之旅,刚刚开始

写此文时,笔者已经带着满满的收获坐在回国的飞机上,期待回去投入创业进程的新一轮奋斗。略有遗憾的是,实在分身乏术,来不及把更多演讲主题中的干货带给大家,御数之旅专题就该向大家说再见了。不过没关系,引用丘吉尔的话说:

It’s not the end;

It’s not the beginning of the end;

Perhaps, it’s just the end of the beginning.

只要你关注数据、从事数据工作,数据治理与管理就在你身边,御数之旅只是更换了一种形式,也希望EDW上能有更多的中国好声音,也希望能早日在国内开展类似的深度论坛。

还是那句话,御数坊致力于把全球最好的数据治理与管理资源带到中国数据从业者身边。

联系我们
地址:北京市海淀区双清路学研大厦B座807室
邮箱:
info@dgworkshop.com.cn
微信号:DGWorkshop_CN
关注我们
Copyright © 2016 御数坊(北京)科技咨询有限公司