Kyligence DeepInsight AI 深度洞察 - 首个企业级自主深度推理和洞察产品发布 立即了解更多
Kyligence DeepInsight
Kyligence AI 数据智能体 Kyligence AI 数据智能体
Kyligence Enterprise Kyligence Enterprise
指标平台解决方案
OLAP 解决方案
行业解决方案
客户总览
金融
零售
制造
医药
其他
云平台
BI
寻求合作
资源
Kyligence Enterprise
Kyligence Zen
培训
Apache Kylin
Byzer
Gluten
博客
关于
市场活动
大数据 OLAP 技术实现了海量数据的在线交互式分析,但在海量数据场景下,当源数据发生变动时,OLAP 系统数据的全量刷新,往往需要很长的刷新时间,同时耗费大量计算资源。如何在给定的 ETL 时间窗口内尽快刷新 OLAP 系统的数据,保障业务能够查询分析最新数据?
Kyligence 通过多种 Cube 增量刷新策略,在保障高并发、高性能查询服务的同时,将数据的刷新时间缩短至分钟级。今天将为大家简要介绍一下 3 种数据增量刷新方式和 Cube 分区。
Kyligence 支持按日期/时间列的数据增量刷新,将最近1 周/ 1 天/ 1 小时,甚至任意时间段内的数据增量刷新进入 Cube。如果您的数据中包含有时间戳字段,比如交易日期、更新日期等,我们建议您使用该字段进行 Cube 数据的增量刷新。每次向Kyligence 提交数据刷新任务时(对应着 Kyligence Cube 构建任务),需要同时提交一个时间区间,这个任务会在 Cube 中生成一个新的 Segment (即数据文件块),正常情况下这些 Segment 的时间区间会形成一个连续不重叠的时间轴,如下图所示:
提示:在实际存储时,Kyligence Enterprise 会将每个 Segment 的时间区间值转换为 Long 类型的数值,因此时间轴实际上是一个 Long 类型的连续数值区间。
对于不会更改的数据,如用户网页浏览记录,这些数据在数据源产生后就不会发生更改,因此每次刷新时仅需将新数据增量刷新进入 Cube (对应 Kyligence 系统提交新的 Cube 构建任务);而对于可能发生更改的数据,比如销售订单,需要留意在提交新数据增量刷新任务的同时,还需要根据发生了更改的数据,对已经构建成功的历史 Segment 进行刷新。
另外,为了避免 Cube 中 Segment 过多,数据文件块过于碎片化从而导致查询性能变慢,我们建议定期对数据不再发生更改的 Segment 进行合并,从而优化存储空间和查询性能。
Kyligence 也支持按文件进行数据增量刷新,以文件为单位将其中的数据增量刷新进入 Cube。如果您的新数据是按批次以若干个文件形式更新至源系统,那么就可能适用 Kyilgence 按文件的增量数据刷新。
对于按文件的增量刷新,Kyligence 会将以每个小时为单位,对每个小时的 N 个批次数据文件进行处理,其中 N 为文件编号。因此,在提交数据刷新任务时,Segment 区间的起始或截止将由日期/小时与文件编号拼接而成,其对应的 Segment 区间序列如下图所示:
大部分情形下,我们推荐您尽可能使用日期/时间列来进行 Cube 数据的增量刷新。但某些场景下,数据并不一定都包含日期/时间列,或者新数据并不能够通过日期/时间列来识别,比如自增型数据编号(类似流式数据的 offset ),财务期间(比如201901,201913等),或者日期 + 数据更新批次号的组合。
因此 Kyligence Enterprise 支持自定义增量刷新,您可以在系统中自定义特定的 Cube 增量构建方法,以满足特定的数据增量刷新需求。您可以实现自定义增量刷新的逻辑,将 Kyligence Cube Segment 区间(Long 类型的数值区间)映射至时间轴区间,并在提交 Cube 构建任务时实现该区间值至数据筛选条件的自定义映射,如下图显示:
另外对于使用Cube 分区,Kyligence 可以实现将结构相同但数据不同的 Cube 统一管理,而无需创建多个 Cube,Cube 数据刷新可以按特定分区进行。比如某个分析主题的 Cube 可以按省份或组织机构设定 Cube 分区,特定省份或组织机构的数据准备完成后,即可刷新 Cube,而无需等待所有省份或组织机构数据准备完成。如下图所示:
同时,每一个分区的数据刷新不仅可以全量刷新,还可以搭配按日期/时间方式,进行增量刷新,以周/天/小时为单位将新增数据构建进入 Cube 中。
通过多种增量刷新策略,Kyligence 在保障高并发、高性能查询服务的同时,避免了海量数据全量刷新带来的时间与计算资源成本,大大缩短了数据刷新时间,保障数据尽快能够服务于业务查询。
更多使用细节,请点击下载用户手册 。
过去几年,Kyligence(跬智信息)多次强调语义层的价值。它能够将复杂的底层数据转化为清晰易懂的业务语言,
Kyligence AI 数据智能体自推出以来,已在金融、零售、制造等行业的客户实际业务中落地,带来了诸多超出
在这家全国性商业银行,数智化早已不再只是“后台支持”,而是深入一线、赋能经营。“建生态、搭场景、扩用户”,六年
2025年1月,DeepSeek 正式发布 DeepSeek-R1 推理大模型。DeepSeek-R1 成本价
近年来,随着商业环境的竞争日益激烈,企业对于实时数据服务的需求急剧增加。Kyligence 在服务众多客户的过
数据要素在银行各业务领域和流程中发挥着至关重要的作用,面对激烈的市场竞争和客户需求,银行越来越注重从数据管理中
作为一名消费者,炎热的夏天我们会走进一家便利店,从冰柜中选出一瓶汽水;下午工作有点累了,我们会在公司的自动贩卖
2024 年伊始,Kyligence 联合创始人兼 CEO 韩卿(Luke)分享了对 AI 与数据行业的一些战
房地产行业是我国国民经济中的重要支柱产业之一,在房地产市场供求关系发生重大变化的当下,房企面临多重挑战。Kyl
400 8658 757
工作日:10:00 - 18:00
已有账号? 点此登陆
预约演示,您将获得
完整的产品体验
从数据导入、建模到分析的全流程操作演示。
行业专家解惑
与资深行业专家的交流机会,解答您的个性化问题。
请填写真实信息,我们会在 1-2 个工作日内电话与您联系。
全行业落地场景演示
涵盖金融、零售、餐饮、医药、制造等多个行业,最贴合您的业务需求与场景。
Data + AI 应用落地咨询
与资深技术专家深入交流,助您的企业快速落地 AI 场景应用。
登记申请,确认后即可体验
超越普通人类专家的 AI 自主深度洞察
体验预置跨行业智能体模板,涵盖金融、零售、餐饮、医药、制造等多个行业,最贴合您的业务需求与场景。
超越大模型的精准数据计算能力
接入高精度数值计算大模型服务,为您的企业级 AI 应用提供强大支持。
Data + AI 落地应用咨询:
与资深专家深入探讨数据和 AI 如何帮助您的企业加速实现应用落地,构建更智能的数据驱动未来。
申请体验,您将获得
体验数据处理性能 2x 加速
同等规模资源、同等量级数据、同一套数据处理逻辑,处理耗时下降一半
专家支持
试用部署、生成数据、性能对比各操作环节在线支持