Kyligence AI 服务 - 让大模型完成准确、可靠的数值计算和回答! 立即了解更多
AI 数智助理
Kyligence Zen Kyligence Zen
Kyligence Enterprise Kyligence Enterprise
Kyligence Turbo Kyligence Turbo
指标平台解决方案
OLAP 解决方案
行业解决方案
客户总览
金融
零售
制造
医药
其他
云平台
BI
寻求合作
资源
Kyligence Enterprise
Kyligence Zen
培训
Apache Kylin
Byzer
Gluten
博客
关于
市场活动
硅谷独角兽、云原生数据仓库厂商Snowflake启动 IPO,其猛增的营收和节节攀升的毛利率,向大家展现了一个正在蓬勃发展的新兴市场。云原生数据仓库市场背后有哪些驱动因素?随着中国企业数字化与上云进程的加速,中国市场是否也有类似的机遇?
据媒体公开报道,硅谷独角兽、云原生数据仓库(Cloud Native Data Warehouse)提供商Snowflake于2020年8月25日正式向美国证券交易委员会递交了上市申请,据其招股书披露的财务数据显示:
· 2020财年(截至2020年1月31日),Snowflake的营收为2.65亿美元,相比于2019财年增幅高达174%。到2021财年上半年(截至2020年7月31日),其营收达到2.42亿美元,相比2020财年上半年增长133%,预计全年营收将超5亿美元。
· 2019财年,Snowflake的毛利率为46.5%,到2020财年则提升到56%,而到2021财年上半年,这一数字进一步提升到61.6%。
据媒体披露,这家2012年才成立的独角兽,其寻求的IPO估值已经高达200亿美元。
尽管“云原生”的概念在近些年刚刚兴起,但数据仓库却并非一个新兴市场,而是有着长达三十年的漫长发展期。而我们要想知道Snowflake如今的估值有多高,可以参考下两家更早进入市场的数据仓库厂商的财务数据和市值:
· 成立于1979年,在传统数据仓库市场占据统治地位的Teradata,在经历连续多年的业绩负增长后,2019财年营收仍有18.99亿美元,但当前市值仅27亿美元。同时,其毛利率更是多年稳定在50%左右,已经难有提升空间。
· 另一家厂商是成立于2008年Cloudera,它基于Hadoop开源体系成长起来,并已经在Hadoop发行版市场中占据统治地位。在经历多年快速增长后,其2020财年营收达7.94亿美元,毛利率高达71%,而当前市值也仅有39亿美元。
可以看到,Snowflake在短短几年时间内,迅速在欧美市场崛起,估值大大超越成立时间更久的同类厂商。
相比于欧美市场,国内的云原生数据仓库市场尚处于早期,尚未出现像Snowflake一样经历如此快速增长的厂商。但是,考虑到中国企业潜在的对数据分析的旺盛需求,以及企业上云进程的逐步深化,中国的云原生数据仓库市场的机遇也值得探讨。
云原生数据仓库市场在美国爆发的成因是什么?国内市场未来的发展趋势如何?有哪些厂商有机会复刻Snowflake的增长轨迹?爱分析基于对中美市场的研究,以及对Snowflake投资方和Kyligence等厂商的调研,来详细探讨上述问题。
要想准确评价“云原生数据仓库”对企业的真实价值,可以先回溯数据仓库的发展历史。
事实上,数据仓库是一项发展历程漫长的技术,其概念确立于上世纪90年代初,定位是为企业信息化建设过程中“烟囱式”数据治理困境提供治理能力,建设面向主题的、跨系统集成的分析型数据库,并最终服务于企业的业务决策。
在过去三十年间,企业对数据仓库的整体定位没有发生根本的改变,即为企业提供业务决策支持。
但是与此同时,数据仓库的技术路线却不断升级,从早期以软硬件一体架构、有限的扩展性、昂贵的扩容成本为特征的第一代数据仓库,逐步发展为基于开源软件框架、适配x86架构通用硬件、适应海量数据的计算、可灵活扩展的第二代数据仓库,以及基于云服务提供的第三代数据仓库。
从第一代数据仓库发展到第二代数据仓库,企业的具体需求变化主要体现在以下两方面:
· 面向海量数据的计算能力:随着数字化业务的增长,企业数据量呈现爆发式增长,数据从几个BP发展到上百PB级别,而第一代数据仓库在面对如此巨大的数据量的时候,会出现明显的性能下降。而第二代数据仓库一般基于Hadoop、Hive、Spark 等开源框架,以及Presto dealdot 等开源MPP架构,能够实现针对海量数据的高效存储和计算。
· 更灵活的扩容能力:随着数字化业务的不断增长,企业对于数据仓库性能扩展的需求性更为迫切,但第一代数据仓库的扩展性较差。因此,第二代数据仓库逐步采取软硬件解绑、适配通用性硬件的分布式架构,为企业提供更加灵活、更低成本的扩容能力。
但是,第二代数据仓库的不足在于仍然需要依托于线下机房,在性能扩容的时候需要采购硬件,由此带来了较为高昂后期运维和扩容成本。
随着云计算的逐步兴起,第三代数据仓库——云数据仓库(Data Warehouse in Cloud)逐步出现,客户在在公有云上低成本、按需、高效地获取数据仓库资源,其优势在于以下两方面:
第三代数据仓库同样存在局限,它更像是把第二代数据仓库直接搬到了云上,但却没有根据云本身的特性更好地对自身进行优化,因此仍然没有达到“云原生”的程度。
但是随着企业数字化深入推进,企业对云的应用程度也越来越深,对数据仓库的需求进一步发生了变化,推动了第四代数据仓库——以Snowflake为代表的“云原生数据仓库”的崛起。
在从DW in Cloud转向Cloud Native DW的过程中,企业的需求变化具体表现在以下几个方面:
1)更精细化的资源管理能力
传统的分布式数据仓库采取计算、存储一体化架构,不支持单独扩展,但在数字化业务增长的驱动下,计算、存储的性能扩展需求往往是不同步的,计算性能往往仅需要在负载高峰期间进行扩展,而存储性能则一般是长期、线性地进行扩展。
因此,云原生数据仓库在对象存储技术之上,采取计算、存储分离的架构,支持计算、存储节点单独扩展,从而实现了资源的精细化管理,有效降低了扩容成本。
2)全民化的数据分析、更高的计算性能
数字化时代,数据分析服务的使用者,从企业决策管理层进一步扩展到专业的数据分析师、一线业务人员,乃至企业外部生态中的合作伙伴。
因此,云原生数据仓库能够实现更优化的性能调度、多租户的权限管理能力,从而支撑海量数据分析用户的并发访问,同时实现跨部门、跨组织、跨地域的安全数据共享能力。
此外,除了来自企业需求的驱动因素,Snowflake之所以能够获得如此快速增长,另外两点原因在于企业IT基础设施的变化。
1)良好的云采纳基础
以AWS为代表的公有云已经深刻重塑了海外企业的IT基础设施,“上云”不但早已成为企业共识,更成为了现实。
事实上,Snowflake的成长周期,几乎与以AWS为代表的云服务厂商逐步建立起统治地位的周期同步。2012年是Snowflake成立的年份,而同样在这一年,AWS举行了首次开发者大会re:Invent,这也标志着云计算的用户群体开始得到空前壮大。
因此,以公有云订阅模式作为其主打商业模式的Snowflake,充分释放了大量公有云客户的数据分析需求,而且公有云特有的轻交付模式使得Snowflake的销售成本极低。
2)多云策略的普及
随着企业多种类型业务的全面上云,以及企业对业务稳定性需求的升级,多云策略同样成为企业共识。
因此,相比于AWS、Azure、谷歌云等公有云之上的云原生数据仓库,Snowflake能够提供非厂商绑定的、兼容多种公有云的、使用体验一致的数据管理能力,还可以进一步在多云之上提供容灾备份能力,中立性优势更加凸显。
红点创投早在2014年就领投了Snowflake的B轮融资。红点中国执行董事刘岚认为,国内云计算市场相比美国要滞后三到五年左右,对于这一点,投资机构们早有普遍预期,而大家更看重的是未来五到十年的成长潜力。从过去几年美国云计算市场的趋势来看,企业在IaaS层的建设结束后,会越来越关注云对企业的业务价值,PaaS与DaaS的重要性会越来越凸显,这也是Snowflake能够崛起的根本原因。
此外,中国的云原生数据仓库市场的发展存在一个很关键的有利因素,就是中国庞大的数据体量及潜在的数据分析需求,相比欧美更加旺盛。
由于中国消费互联网市场的爆发式增长,企业内沉淀下来的可供挖掘的数据比欧美更加丰富。因此,在中国经济转型的大背景下,企业对于挖掘数据价值的诉求比欧美更加旺盛。同时,由于国内同行业竞争的激烈程度,企业对于数据服务的敏捷型需求也更加迫切。
相比于美国市场,国内云原生数据仓库市场的竞争格局尚不明朗。首先,阿里云、华为云等公有云巨头厂商已经布局该市场,成为该市场里面的重要玩家。
在独立厂商方面,成立于2016年,源自Apache开源基金会项目Apache Kylin的中国云原生数据仓库厂商Kyligence,是红点创投在中国市场看好的一家独立厂商。红点创投是Kyligence的天使轮投资方,并持续跟投了A轮、B轮和C轮。
Kyligence作为一家独立厂商,在2016到到2019年间的短短三年时间,就已经完成四轮融资 。相比于公有云厂商,Kyligence的优势与Snowflake类似,同样在于更加中立的背景,带来了其在多云策略下的独特地位。
红点中国执行董事刘岚还认为,数据仓库作为一类企业级的基础软件,其需求相对标准化,这意味着其未来的市场集中度一定是较高的。
爱分析认为,由于独立厂商在云原生数据仓库市场中的独特价值,未来中国市场有机会诞生一家独角兽公司。
Kyligence于2017年12月正式发布云原生数据仓库产品——智能数据云Kyligence Cloud,就是其基于领先的OLAP技术,结合云上大数据的最佳实践,为企业客户提供快速、易用、安全、可扩展、低成本的端到端大数据分析解决方案,从而支撑企业日益增长的云上分析业务。
KyligenceCloud兼容Azure、AWS、阿里云、谷歌云等多种公有云平台,能够接入来自业务系统、在线数据、日志数据、流式数据等多种类型数据源,并基于Spark等分布式开源框架和云对象存储功能,实现计算、存储能力的分离。
在以上这些能力基础之上,Kyligence结合自研的AI增强引擎和统一语义层技术,能够为分析师和最终用户提供全组织统一的、整合过的及优化过的全局数据视图,不论是在数据中心还是多云部署,帮助企业发现和管理最有价值数据,进一步简化超大规模数据的管理,高效支撑BI可视化、Excel报表分析、机器学习与数据挖掘等多种业务场景。今年,Kyligence也入选了《2020年中国ICT技术成熟度曲线报告》增强数据分析(Augmented Data and Analytics)代表厂商。
正如前文所述,云原生数据仓库的主要价值之一,在于应对多租户环境下的高并发分析痛点。这样的痛点在大型银行、零售企业、制造企业、房地产商等部门和员工众多的集团型企业,以及SaaS厂商等拥有众多企业客户的科技型公司,表现得尤为突出。
以Kyligence的海外某SaaS企业用户为例,该企业的200多家客户分布在全球40多个国家,涵盖了500强企业的三分之一,其SaaS平台上产生的年交易量达到80亿美元,而交易产生的数据量更为庞大。
该企业提供的SaaS平台,具备一项功能是为客户提供仪表盘(dashboard)可视化页面的功能,而数据源则来自于SaaS底层的数据仓库。这意味着即该企业的每家客户仅有一个账号,那么也会有超过200个用户同时访问数据仓库。
过去,该企业采用第三代数据仓库,即DW in Cloud的模式,面临的问题是在高并发的状况下,用户访问性能明显下降,不得不建立大量固化视图。尽管这种做法收获了一定效果,但是从长期来看,视图的创建和维护成本越来越高,而且最多仅能支撑10个左右的并发访问量。
因此,该企业在重新选择大数据平台过程中,选择了Kyligence Cloud,最终实现了以下几方面的效果:
由于种种因素,中国大中型企业在上云步伐中,明显滞后于欧美市场,而且私有云占云计算整体市场的比重相对更高。
因此,Kyligence作为一家同时在中美市场发力的国际化厂商,其中美市场的进入策略存在一定差异。在美国市场,Kyligence已经入驻了AWS、Azure的应用市场,客户只需在线购买就可使用。但在中国市场,Kyligence在推动公有云PaaS商业模式外,提供更适合中国企业级客户的私有云部署版本,并对各类常见的私有云厂商产品进行了充分适配。通过中国客户独有的场景、数据量及业务需求,进一步改进和增强核心产品。
但是,Kyligence认为,中美市场最终发展的方向会“殊途同归”。
首先,中美企业的需求是完全一致的,即都是为了让数据仓库在云上以服务化的方式交付给企业,同时让企业以订阅式、按需取用的方式来获取数据仓库。
其次,中国企业对公有云的接受程度也越来越高。尽管金融行业由于政策性因素,仍然难以大规模采用公有云,但许多零售、制造等传统行业的客户,已经开始将创新业务乃至核心业务逐步迁移到公有云上。
Kyligence透露,现阶段Kyligence Cloud的公有云客户占比在40%左右,但是未来随着企业对公有云的接受度提升,这一比例将有望提升到70%,向Snowflake进一步靠拢。
此外,随着国内企业付费观念的变化,Kyligence Cloud目前已经开始广泛采用订阅式的收费模式来服务于私有云客户,这也是国内厂商当中比较领先的商业模式尝试。Kyligence认为,这一模式的最大价值,一方面帮助客户进一步降低了云端数据管理和分析的成本,同时也驱动厂商自身始终保持帮助客户成功,实现与客户长期共生和互利关系。
爱分析认为,智能数据云Kyligence Cloud带给企业的最大价值,在于通过云原生技术重构了企业的大数据平台,充分适应了云时代的客户诉求,帮助企业解决了全民化数据分析时代下的大数据量计算、高并发量访问、安全权限管控等痛点。因此,云原生数据仓库市场在中国的黄金时代,可能很快就会到来。
近日,跬智信息再次荣获中国电子工业标准化技术协会、信息技术应用创新工作委员会(以下简称“信创工委会”)联合颁发
8月22日,2024 AGI 商业趋势大会在深圳圆满落幕。会上,2024 AIGC 年度榜单重磅揭晓。经创业邦
2023年7月,Kyligence 对外正式推出 AI 数智助理 Kyligence Copilot,致力于用
近日,大家期待已久的企业级智能多维数据库 Kyligence Enterprise 5(KE5)带来了重大更新
36氪 2024 AI 应用标杆案例近日揭晓,Kyligence AI 解决方案从 200 多个报名项目中脱颖
来源丨InfoQ 作者丨鲁冬雪 随着数字化时代的快速发展,“数智化”已经成为企业获取竞争优势、
4月11日,Kyligence 2024 数智论坛暨春季发布会成功召开。Kyligence 正式发布全新的企业
3月14日至15日,华为中国合作伙伴大会 2024 在深圳召开。本次大会以“因聚而生,数智有为”为主题,皆在升
3月11日-13日,Gartner 2024 数据与分析峰会 (Gartner Data & Anal
400 8658 757
工作日:10:00 - 18:00
已有账号? 点此登陆
预约演示,您将获得
完整的产品体验
从数据导入、建模到分析的全流程操作演示。
行业专家解惑
与资深行业专家的交流机会,解答您的个性化问题。
请填写真实信息,我们会在 1-2 个工作日内电话与您联系。
全行业落地场景演示
涵盖金融、零售、餐饮、医药、制造等多个行业,最贴合您的业务需求与场景。
Data + AI 应用落地咨询
与资深技术专家深入交流,助您的企业快速落地 AI 场景应用。
立即预约,您将获得
精准数据计算能力:
接入高精度数值计算大模型服务,为您的企业级AI应用提供强大支持。
个性化业务场景解决方案:
量身定制的计算模型和数据分析服务,切实贴合您的业务需求和应用场景。
Data + AI 落地应用咨询:
与资深专家深入探讨数据和 AI 如何帮助您的企业加速实现应用落地,构建更智能的数据驱动未来。
申请体验,您将获得
体验数据处理性能 2x 加速
同等规模资源、同等量级数据、同一套数据处理逻辑,处理耗时下降一半
专家支持
试用部署、生成数据、性能对比各操作环节在线支持