Kyligence AI 服务 - 让大模型完成准确、可靠的数值计算和回答! 立即了解更多
AI 数智助理
Kyligence Zen Kyligence Zen
Kyligence Enterprise Kyligence Enterprise
Kyligence Turbo Kyligence Turbo
指标平台解决方案
OLAP 解决方案
行业解决方案
客户总览
金融
零售
制造
医药
其他
云平台
BI
寻求合作
资源
Kyligence Enterprise
Kyligence Zen
培训
Apache Kylin
Byzer
Gluten
博客
关于
市场活动
作者:李栋、翟鹿渊 编辑:Sammi
KAP2.4新特性之Cube优化器:基于数据特性与业务常用SQL样例,可以一键输出Cube优化设置,帮助分析师快速上手Cube的设计与优化。
什么是Cube
Cube是数据仓库中一个经典的概念。数据仓库作为一种数据环境,具有面向分析、提供企业决策支持的重要作用。而在数据仓库中,多维数据模型能够满足大多数企业的数据分析需求——它提供了多角度多层次的分析应用,比如基于时间维度、地域维度等构建的销售星形模型、雪花模型,可以实现在各时间维度和地域维度的交叉查询,以及基于时间维度和地域维度的细分。
数据立方体(Data Cube)是多维模型的一个形象的说法。Cube本身只有三维,但多维模型不仅限于三维模型,可以组合更多的维度。正是多个维度,甚至几十个维度的Cube,才能全面满足企业的复杂分析场景、上下钻取、切片切块等决策分析需求。
优化Cube,多维分析建模关键
Cube虽然能存储大量维度,但随着维度增加, Cube所需要的存储空间也会呈几何倍数增长。比如一个Cube中包含了N个维度,那么这N个维度将生成2N 个维度组合。这些成倍增长的维度组合中,有很多在Cube的生命周期里都不会被使用,同时由于维度组合数爆炸而带来的存储膨胀、构建时间冗长、甚至查询性能下降的弊病,都使Cube毁誉参半。
为了解决这个问题Kyligence Analytics Platform( KAP )提供了多种场景下,对Cube的优化设置,帮助用户筛选出真正会被使用到的 Cube维度组合,避免大量存储资源被无效的维度组合耗用,缩短Cube构建时间。优化设置包括衍生维度、聚合组、联合维度、层级维度、必要维度和Rowkey等。
结合不同的业务场景,合理的使用这些优化设置能够使数据建模事半功倍。根据这些优化设置的方法,业务分析师可以定制精确满足业务场景的Cube,避免Cube爆炸的问题。同时,KAP也提供了一键优化Cube的优化器,基于数据特性与常用SQL优化Cube,帮助分析师快速掌握优化Cube的关键。
基于数据特性的优化是指从模型检测的统计结果分析数据列之间的相关性;基于查询模式的优化主要指基于用户给定的常用SQL样例,分析数据列之间在SQL中呈现的相关性。综合两者的因素寻找可以做为层级维度、联合维度、必要维度的维度组,以及调整Rowkey顺序。
使用优化器,提升分析师生产力
Cube优化器对分析师非常友好,学习门槛低、上手快、使用方便。 优化器主要用于Cube设计的步骤,在使用前需要有一个已经设计好的数据模型。
在保存模型时,会看到默认勾选的模型检测功能,代表在保存时触发模型检测功能。一般在合适的资源环境下,模型检测都能在十几分钟内结束。
添加一个Cube。在Cube设计页可以看到关于Cube优化器的使用前提。如果此时模型检测已经完成,则检测结果返回如下。模型检测是Cube优化器一个非常重要的前置条件,一方面确保了模型设计的基本正确,另一方面对模型进行了充分的统计分析。
在本页也可以输入常用的查询SQL。这一特性帮助Cube优化器更好的参考业务查询中隐含的商业逻辑,有效提高Cube对业务的贴合程度。
下一步,进入维度设计。单击“添加维度”按钮,可以勾选需要的Cube维度。勾选后默认的维度类型为Cube优化器的推荐结果,可以根据业务场景的差别而修改。完成后如下图,此时聚合组中还没有任何优化设置。
选好维度后,可以开始优化聚合组。有了Cube优化器之后,点击“优化维度”,可以直接输出聚合组的推荐优化设置。除了常规的必需维度,层级维度,联合维度之外,还包含Rowkey编码的推荐与排序,以及最大维度组合数的推荐值。
如果没有额外的优化需求,维度优化的部分就已经可以结束。点击“下一步”后,进入度量编辑。度量编辑页也有自动的“优化度量”与手工“添加度量”,方便分析师根据业务场景进行调整。
后续的Cube设计步骤与一般的编辑无差。获取更多细节请参考对应版本的产品手册。
优化器小结
优化器主要对原始数据的数据特性和用户的查询模式进行分析,根据Cube调优的最佳实践,推荐出优化后的Cube设计。原理上,Cube优化器同时考虑了基于数据特性的优化和基于查询需求的优化。
Cube优化器将Cube推向了智能优化的方向,可高效地提升Cube设计与加速Cube构建,是分析师设计多维模型的一把利器。
关于Kyligence Analytics Platform (KAP)
KAP是Kyligence提供的基于Apache Kylin的下一代企业级数据仓库及商务智能大数据分析平台,Kyligence由首个来自中国的Apache软件基金会顶级开源项目Apache Kylin核心团队组建。KAP支持超大数据集上的亚秒级查询分析,提供互联网级的高并发能力,赋能分析师以行业标准数据仓库与商业智能实施方法论架构基于Hadoop的数据仓库解决方案。从私有部署到云计算平台,都能使用户在超大规模数据集上获得极速的洞察能力,以释放数据价值,驱动业务增长。
近年来,随着商业环境的竞争日益激烈,企业对于实时数据服务的需求急剧增加。Kyligence 在服务众多客户的过
数据要素在银行各业务领域和流程中发挥着至关重要的作用,面对激烈的市场竞争和客户需求,银行越来越注重从数据管理中
作为一名消费者,炎热的夏天我们会走进一家便利店,从冰柜中选出一瓶汽水;下午工作有点累了,我们会在公司的自动贩卖
2024 年伊始,Kyligence 联合创始人兼 CEO 韩卿(Luke)分享了对 AI 与数据行业的一些战
房地产行业是我国国民经济中的重要支柱产业之一,在房地产市场供求关系发生重大变化的当下,房企面临多重挑战。Kyl
今年年初,Kyligence 高级副总裁兼合伙人葛双寅(Silas Ge)受邀在阿斯利康“跃行致远三十周年年会
2024 年伊始,Kyligence 联合创始人兼 CEO 韩卿在公司内部的飞书订阅号发表了多篇 Rethin
400 8658 757
工作日:10:00 - 18:00
已有账号? 点此登陆
预约演示,您将获得
完整的产品体验
从数据导入、建模到分析的全流程操作演示。
行业专家解惑
与资深行业专家的交流机会,解答您的个性化问题。
请填写真实信息,我们会在 1-2 个工作日内电话与您联系。
全行业落地场景演示
涵盖金融、零售、餐饮、医药、制造等多个行业,最贴合您的业务需求与场景。
Data + AI 应用落地咨询
与资深技术专家深入交流,助您的企业快速落地 AI 场景应用。
立即预约,您将获得
精准数据计算能力:
接入高精度数值计算大模型服务,为您的企业级AI应用提供强大支持。
个性化业务场景解决方案:
量身定制的计算模型和数据分析服务,切实贴合您的业务需求和应用场景。
Data + AI 落地应用咨询:
与资深专家深入探讨数据和 AI 如何帮助您的企业加速实现应用落地,构建更智能的数据驱动未来。
申请体验,您将获得
体验数据处理性能 2x 加速
同等规模资源、同等量级数据、同一套数据处理逻辑,处理耗时下降一半
专家支持
试用部署、生成数据、性能对比各操作环节在线支持