Kyligence Copilot - AI 数智助理,以 AI 变革企业经营与管理! 立即了解更多
AI 数智助理
Kyligence Zen Kyligence Zen
Kyligence Enterprise Kyligence Enterprise
Kyligence Turbo Kyligence Turbo
指标平台解决方案
OLAP 解决方案
行业解决方案
客户总览
金融
零售
制造
医药
其他
云平台
BI
寻求合作
资源
Kyligence Enterprise
Kyligence Zen
培训
Apache Kylin
Byzer
Gluten
博客
关于
市场活动
Kyligence MDX 支持创建层级结构。层级结构是基于维度的级别集合,可以显著提升数据分析人员的分析能力。此外,Kyligence MDX 还支持对指定的层级指定权重,方便您自定义成员值的汇总方式。本篇博客我们将继续 Curly's 公司的例子,我们之前讲到了 Curly's 如何通过千笔订单商品数量来衡量各门店的综合销售能力,在这篇博客中,我们将来查看当同一件商品分别存在于不同的商品分类时,如何通过 Kyligence MDX 的自定义上卷实现去重。
首先我们来回顾下 Curly's 公司的主营业务。Curly's 是一家快速增长中的中型餐饮公司,在全国有十多家门店,提供优质低价的快餐食品,其中精品冰淇淋、咖啡、炸鸡等更是广受好评。为了更方便不同消费群体的消费需求,他们在点单系统将产品进行了非常友好的分类,比如有专门针对朋友聚会的 Party Specials 分类。很显然,分类对用户友好的同时,也给后台分析系统造成了一定的困扰,如下所示,“鸡翅”和“鸡块”同时位于“炸鸡”和“小食”分类之下;即某一个维度值存在上一级的共享维度,这就意味着当该层级结构和事实表进行连接的时候,会造成“鸡翅”和“鸡块”的事实表数据出现重复。
比如在上表中,如果单纯把销售金额加总,那鸡块和鸡翅的销售金额必然会被重复计算。为解决此类问题,Kyligence MDX 引入了自定义上卷功能,比如在本例中,我们将对“鸡翅”和“鸡块”相对其上级层级设置一个权重,例如:从业务的视角,认为“鸡翅”对“炸鸡”和“小食”分类的贡献相同,因此“鸡翅”在“炸鸡”上的权重值设为 0.5,在“小食”上的权重也设为 0.5,因此鸡翅和鸡块在各分类下的计算公式如下:
总数量 = 实际销售量 * 分类权重 * 产品权重
假设鸡翅的销售量为 100 件,
那它在炸鸡分类的计算销售量就是 :100 * 0.5 * 1 = 50 (件)
它在小食分类的计算销售量也是 :100 * 0.5 * 1 = 50 (件)
具体实现如下表所示:
事实表:FACT_CATEGORY_PRODUCT
维度表 DIM_CATEGORY_PRODUCT
1.在试用页面,点击开始新的试用。系统将跳转至在线试用环境界面,点击开始。系统将开始准备您的试用环境,预计将在 15 分钟内准备完毕。当试用环境准备就绪,我们会向您发送通知邮件,您可以点击试用页面或邮件中的按钮(链接)开始试用。
2.我们接下来将开始数据源的准备,点击数据源下的管理。
3. 点击创建表,选择上传 CSV,我们将针对本项目创建一个新的数据库,并命名为 MDX_ROLLUP,同时输入表名,点击下一步,在随后的页面中点击提交,至此,我们完成了第一张表的上传。重复这一步骤,完成第二张表的上传,唯一的不同是我们这次将选择已经创建好的 MDX_ROLLUP 数据集。
4. 创建表之后,我们需要继续进行表的加载,点击数据源 > 加载表,点击选择 MDX_ROLLUP,点击提交。系统将返回数据加载成功,至此,我们完成了数据准备工作。
由于表关系较为简单,我们只需在 Kyligence 中定义表的关联关系即可,无需通过 SQL 建模。
1.点击 模型 > + 模型,输入模型名称 MDX_ROLLUP,点击提交。
2. 系统跳转到模型页,在左侧的数据源中选中事实表,将其拖拽至右侧画布中,并将其定义为事实表,再次拖拽维度表到画布中。通过 PID (产品 ID)列定义两表的关联关系。
3. 接下来,点击画布右上角的维度窗口添加维度,我们这里将增加事实表和维度表中的所有列为维度,点击提交。
4. 接下来我们将增加度量,通过事实表中的 AMOUNT 列计算总的销售额,点击右侧的度量窗口,点击➕号,在弹出的添加度量对话框中,选择 SUM (column) 函数,并选中事实表中的 AMOUNT 列,输入一个业务友好的度量名称,点击提交。
5.至此,我们完成了表关联关系、维度和度量的添加,点击保存,在随即弹出的保存对话框中选择全量加载,点击提交。
6. 系统随即提示模型保存成功,点击查看索引前往索引页面。在索引总览页签,点击勾选全部索引,并点击构建索引,充分发挥 Kyligence 的预计算能力加速查询。
至此我们已经完成模型的创建,接下来我们将点击左侧导航窗口的连接 BI,进行 Kyligence MDX 进行数据集的设置。
1.通过 Test drive 账户继续登陆 Kyligence MDX,在左侧导航栏点击数据集,点击创建数据集。输入新数据集名称,例如 MDX_ROLLUP.
2. 定义关系页面,从左侧的模型列表中选择刚刚创建的 MDX_ROLLUP 模型,并将其拖入右侧的画布中,随后点击下一步。
3. 在定义语义页签,我们将创建一个新的层级关系来关联模型中的代表产品的维度列和权重列。在维度一栏,点击增加层级按钮,在右侧出现的增加层级结构栏中,输入层级名称,如 Product_Category,在模型/表中,选择我们创建的 MDX_ROLLUP 模型以及维度表 DIM_PRODUCT_CATEGORY,在层级结构中,选择我们的 CATEGORY 和 PRODNAME 列。
至此,我们完成了商品、分类和对应权重的关联,接下来可以前往 excel 进行数据分析。
1.回到 Test Drive 的连接 BI 页签,点击 Excel,您可以在弹窗中获取 Excel连接信息。
2.打开 Excel,选择 数据 -> 获取数据 -> 来自数据库 -> 自 Analysis Services。将服务器地址输入名称栏,输入 Kyligence 账号用户名和密码,点击下一步,即可完成数据集和 Excel 间的连接。
如下图所示,勾选 COUNT_ALL,总销售额、Product_Category_Hierarchy,我们就可以在 Excel 中按照商品分类查看各商品的销售额以及总的销售额。
除文中提到的方法外,我们也可以通过 Kyligence 的可计算列实现赋权操作,敬请期待更多相关博客。
接下来,我们将推出更多 Kyligence Test Drive 的实际使用场景类博客,敬请期待。
上海跬智信息技术有限公司 (Kyligence) 由 Apache Kylin 创始团队于 2016 年创办,致力于打造下一代企业级智能多维数据库,为企业简化数据湖上的多维数据分析(OLAP)。通过 AI 增强的高性能分析引擎、统一 SQL 服务接口、业务语义层等功能,Kyligence 提供成本最优的多维数据分析能力,支撑企业商务智能(BI)分析、灵活查询和互联网级数据服务等多类应用场景,助力企业构建更可靠的指标体系,释放业务自助分析潜力。
Kyligence 已服务中国、美国、欧洲及亚太的多个银行、证券、保险、制造、零售等行业客户,包括建设银行、浦发银行、招商银行、平安银行、宁波银行、太平洋保险、中国银联、上汽、Costa、UBS、MetLife 等全球知名企业,并和微软、亚马逊、华为、Tableau 等技术领导者达成全球合作伙伴关系。目前公司已经在上海、北京、深圳、厦门、武汉及美国的硅谷、纽约、西雅图等开设分公司或办事机构。
当订单与销售明细在不同的事实表,千笔订单商品数量如何计算?Kyligence Cloud + Kyligence MDX 三步实现跨事实表分析,带你利用数据更准确地洞察经营状态,如对比不同门店的同期销售状况!
数据分析日益增长的多样化需求 信息化时代之初,由于大部分员工缺乏大数据相关的技能和培训,分析和解释数据的话语权
数据网格(Data Mesh)是由 Thoughtworks 提出的一种数据域驱动的分析架构,其中数据被视为一
当前,云上部署正逐渐成为全球众多企业 IT 部署模式的新选择。而在国内,由于国家的监管需求,一些行业数据仍然被
1. Hadoop 知多少 对于大数据玩家而言,Hadoop 绝不陌生。Apache Hadoop 作为一个完
现代企业愈发需要利用海量数据的价值进行量化运营、辅助决策洞察,在线联机分析 OLAP(Online
Kylin 入选《上海市重点领域(金融类)“十四五”紧缺人才开发目录》 数字经济已成为全球增长新动
前言 大家都知道,数据分析项目从需求提出到最终交付要经历一个漫长的过程,需要进行数据源整合、指标定义、模型开发
本文译自:The Citizen Data Analyst: The Pivotal Element in A
400 8658 757
工作日:10:00 - 18:00
已有账号? 点此登陆
预约演示,您将获得
完整的产品体验
从数据导入、建模到分析的全流程操作演示。
行业专家解惑
与资深行业专家的交流机会,解答您的个性化问题。
请填写真实信息,我们会在 1-2 个工作日内电话与您联系。
全行业落地场景演示
涵盖金融、零售、餐饮、医药、制造等多个行业,最贴合您的业务需求与场景。
Data + AI 应用落地咨询
与资深技术专家深入交流,助您的企业快速落地 AI 场景应用。
申请体验,您将获得
体验数据处理性能 2x 加速
同等规模资源、同等量级数据、同一套数据处理逻辑,处理耗时下降一半
专家支持
试用部署、生成数据、性能对比各操作环节在线支持