Kyligence AI 服务 - 让大模型完成准确、可靠的数值计算和回答! 立即了解更多
AI 数智助理
Kyligence Zen Kyligence Zen
Kyligence Enterprise Kyligence Enterprise
Kyligence Turbo Kyligence Turbo
指标平台解决方案
OLAP 解决方案
行业解决方案
客户总览
金融
零售
制造
医药
其他
云平台
BI
寻求合作
资源
Kyligence Enterprise
Kyligence Zen
培训
Apache Kylin
Byzer
Gluten
博客
关于
市场活动
大数据 OLAP 技术实现了海量数据的在线交互式分析,但在海量数据场景下,当源数据发生变动时,OLAP 系统数据的全量刷新,往往需要很长的刷新时间,同时耗费大量计算资源。如何在给定的 ETL 时间窗口内尽快刷新 OLAP 系统的数据,保障业务能够查询分析最新数据?
Kyligence 通过多种 Cube 增量刷新策略,在保障高并发、高性能查询服务的同时,将数据的刷新时间缩短至分钟级。今天将为大家简要介绍一下 3 种数据增量刷新方式和 Cube 分区。
Kyligence 支持按日期/时间列的数据增量刷新,将最近1 周/ 1 天/ 1 小时,甚至任意时间段内的数据增量刷新进入 Cube。如果您的数据中包含有时间戳字段,比如交易日期、更新日期等,我们建议您使用该字段进行 Cube 数据的增量刷新。每次向Kyligence 提交数据刷新任务时(对应着 Kyligence Cube 构建任务),需要同时提交一个时间区间,这个任务会在 Cube 中生成一个新的 Segment (即数据文件块),正常情况下这些 Segment 的时间区间会形成一个连续不重叠的时间轴,如下图所示:
提示:在实际存储时,Kyligence Enterprise 会将每个 Segment 的时间区间值转换为 Long 类型的数值,因此时间轴实际上是一个 Long 类型的连续数值区间。
对于不会更改的数据,如用户网页浏览记录,这些数据在数据源产生后就不会发生更改,因此每次刷新时仅需将新数据增量刷新进入 Cube (对应 Kyligence 系统提交新的 Cube 构建任务);而对于可能发生更改的数据,比如销售订单,需要留意在提交新数据增量刷新任务的同时,还需要根据发生了更改的数据,对已经构建成功的历史 Segment 进行刷新。
另外,为了避免 Cube 中 Segment 过多,数据文件块过于碎片化从而导致查询性能变慢,我们建议定期对数据不再发生更改的 Segment 进行合并,从而优化存储空间和查询性能。
Kyligence 也支持按文件进行数据增量刷新,以文件为单位将其中的数据增量刷新进入 Cube。如果您的新数据是按批次以若干个文件形式更新至源系统,那么就可能适用 Kyilgence 按文件的增量数据刷新。
对于按文件的增量刷新,Kyligence 会将以每个小时为单位,对每个小时的 N 个批次数据文件进行处理,其中 N 为文件编号。因此,在提交数据刷新任务时,Segment 区间的起始或截止将由日期/小时与文件编号拼接而成,其对应的 Segment 区间序列如下图所示:
大部分情形下,我们推荐您尽可能使用日期/时间列来进行 Cube 数据的增量刷新。但某些场景下,数据并不一定都包含日期/时间列,或者新数据并不能够通过日期/时间列来识别,比如自增型数据编号(类似流式数据的 offset ),财务期间(比如201901,201913等),或者日期 + 数据更新批次号的组合。
因此 Kyligence Enterprise 支持自定义增量刷新,您可以在系统中自定义特定的 Cube 增量构建方法,以满足特定的数据增量刷新需求。您可以实现自定义增量刷新的逻辑,将 Kyligence Cube Segment 区间(Long 类型的数值区间)映射至时间轴区间,并在提交 Cube 构建任务时实现该区间值至数据筛选条件的自定义映射,如下图显示:
另外对于使用Cube 分区,Kyligence 可以实现将结构相同但数据不同的 Cube 统一管理,而无需创建多个 Cube,Cube 数据刷新可以按特定分区进行。比如某个分析主题的 Cube 可以按省份或组织机构设定 Cube 分区,特定省份或组织机构的数据准备完成后,即可刷新 Cube,而无需等待所有省份或组织机构数据准备完成。如下图所示:
同时,每一个分区的数据刷新不仅可以全量刷新,还可以搭配按日期/时间方式,进行增量刷新,以周/天/小时为单位将新增数据构建进入 Cube 中。
通过多种增量刷新策略,Kyligence 在保障高并发、高性能查询服务的同时,避免了海量数据全量刷新带来的时间与计算资源成本,大大缩短了数据刷新时间,保障数据尽快能够服务于业务查询。
更多使用细节,请点击下载用户手册 。
近年来,随着商业环境的竞争日益激烈,企业对于实时数据服务的需求急剧增加。Kyligence 在服务众多客户的过
数据要素在银行各业务领域和流程中发挥着至关重要的作用,面对激烈的市场竞争和客户需求,银行越来越注重从数据管理中
作为一名消费者,炎热的夏天我们会走进一家便利店,从冰柜中选出一瓶汽水;下午工作有点累了,我们会在公司的自动贩卖
2024 年伊始,Kyligence 联合创始人兼 CEO 韩卿(Luke)分享了对 AI 与数据行业的一些战
房地产行业是我国国民经济中的重要支柱产业之一,在房地产市场供求关系发生重大变化的当下,房企面临多重挑战。Kyl
今年年初,Kyligence 高级副总裁兼合伙人葛双寅(Silas Ge)受邀在阿斯利康“跃行致远三十周年年会
2024 年伊始,Kyligence 联合创始人兼 CEO 韩卿在公司内部的飞书订阅号发表了多篇 Rethin
400 8658 757
工作日:10:00 - 18:00
已有账号? 点此登陆
预约演示,您将获得
完整的产品体验
从数据导入、建模到分析的全流程操作演示。
行业专家解惑
与资深行业专家的交流机会,解答您的个性化问题。
请填写真实信息,我们会在 1-2 个工作日内电话与您联系。
全行业落地场景演示
涵盖金融、零售、餐饮、医药、制造等多个行业,最贴合您的业务需求与场景。
Data + AI 应用落地咨询
与资深技术专家深入交流,助您的企业快速落地 AI 场景应用。
立即预约,您将获得
精准数据计算能力:
接入高精度数值计算大模型服务,为您的企业级AI应用提供强大支持。
个性化业务场景解决方案:
量身定制的计算模型和数据分析服务,切实贴合您的业务需求和应用场景。
Data + AI 落地应用咨询:
与资深专家深入探讨数据和 AI 如何帮助您的企业加速实现应用落地,构建更智能的数据驱动未来。
申请体验,您将获得
体验数据处理性能 2x 加速
同等规模资源、同等量级数据、同一套数据处理逻辑,处理耗时下降一半
专家支持
试用部署、生成数据、性能对比各操作环节在线支持