福布斯技术委员会|重新思考下一代数据集市

本文首发于 forbes.com,已获原作者授权翻译转载

 

对很多人来说,数据集市并不是一个全新的概念了。在十多年前,就有企业将数据集市作为连接数据仓库和数据分析师之间的桥梁。然而,随着企业数据量的不断增长,人们更希望能通过较小的数据集来获取洞察,因此,也是时候开始思考如何更好地利用数据集市,当然,更重要的是,研究下一代数据集市究竟能带给我们什么。

 

进行数据分析时,如果能从数据集市而不是数据仓库或其他外部数据源中获取数据,那么除了能缩短时间,还能帮助企业获得更有针对性的洞察。

 

01

 

固定数据和数据孤岛带来的挑战

 

数据日益成为驱动企业战略决策的工具,数据分析师的岗位也变得更加特殊。现在,企业的大多数决定都离不开多层数据,虽然说“人人都是数据分析师”可能有些夸张,但从一定程度上讲,人人其实已经在做部分数据分析师的工作。我们在消费数据的同时也在不断创造新的数据,从财务、市场营销、再到销售、研发,数据无处不在。

 

但即使今天,数据仍被割裂在不同的云环境中,很难通过单一平台收集。这些云彼此之间并不“交流”,那么基于此,如何让数据创造更大的价值?这个技术瓶颈也影响了一些有价值数据的使用。通过呈现选定的、固定数据,现有的数据集市可以在一定程度上缓解该问题,但用户往往只能基于已有数据进行选择。

 

如果数据集市更像一个 C2C (Customer to Customer) 市场呢?人人都可以带自己的产品进场,同时还能结合他人的产品推陈出新。举个例子,我有一个很棒的茶杯,而你恰好有一个相称的茶壶,将它们结合在一起就有了一套出色的茶具,还能创造额外的附加价值。

 

这就是下一代数据集市。

 

下一代数据集市将改变传统的数据思考结构,企业将能更轻松地获取来自不同来源的更多数据,以便更好地满足业务需求

 

02

 

数据即产品

 

通过下一代数据集市来组合数据,人人都将能基于现有数据开发新产品或创造新的价值,实现产品的提升与创新。但要做到这一点,数据必须易于分享、支持互相连接(Connect),而不能像过去单纯地集中存储数据(Collect)。

 

数据应该被更广泛地传播,这样才能影响更多的人;下一代数据集市的协作性也将赋予数据更高的曝光度。如果数据只在企业内部使用,它的价值将严重受限;但如果能通过下一代数据集市的连接与协作实现共享,数据的价值将被无限放大。当数据被转化为产品,就能广泛应用于企业内外,并轻松与其他团队或客户分享。

 

各行各业正积极转向下一代数据集市,希望借此提升企业价值。下一代的数据集市与数据网格(Data Mesh)的构想类似,也契合当下大家所达成共识的——业务部门只有将数据作为产品,才能从中获取价值。数据网格希望能通过组合多领域的数据来开发新产品,当这种做法成为业界常态,数据将更活跃,也将能从各领域创造和附加更多的价值。

 

下一代数据集市将促使企业及组织转变对数据的思维方式。在此之前,数据集市常被企业用来提供内部商业智能。在这一转变发生后,数据将成为产品,数据集市也将成为一个新的市场。通过数据市场,最终将能实现一站式的数据价值挖掘和数据潜力开发。

 

关于 Kyligence 

 

Kyligence 由 Apache Kylin 创始团队创建,致力于打造下一代智能数据云平台,为企业实现自动化的数据服务和管理。基于机器学习和 AI 技术,Kyligence 从多云的数据存储中识别和管理最有价值数据,并提供高性能、高并发的数据服务以支撑各种数据分析与应用,同时不断降低 TCO。Kyligence 已服务中国、美国及亚太的多个银行、保险、制造、零售等客户,包括建设银行、浦发银行、招商银行、平安银行、宁波银行、太平洋保险、中国银联、上汽、一汽、安踏、YUMC、Costa、UBS、Metlife、AppZen 等全球知名企业和行业领导者。公司已通过 ISO9001,ISO27001 及 SOC2 Type1 等各项认证及审计,并在全球范围内拥有众多生态合作伙伴。