Kyligence DeepInsight AI 深度洞察 - 首个企业级自主深度推理和洞察产品发布 立即了解更多
Kyligence DeepInsight
Kyligence AI 数据智能体 Kyligence AI 数据智能体
Kyligence Enterprise Kyligence Enterprise
指标平台解决方案
OLAP 解决方案
行业解决方案
客户总览
金融
零售
制造
医药
其他
云平台
BI
寻求合作
资源
Kyligence Enterprise
Kyligence Zen
培训
Apache Kylin
Byzer
Gluten
博客
关于
市场活动
近日,Apache Kylin 社区很高兴地宣布,Apache Kylin v2.6.0 正式发布。
Apache Kylin 是一个开源的分布式分析引擎,旨在为极大数据集提供 SQL 接口和多维分析(OLAP)的能力。
Apache Kylin v2.6.0 是继 v2.5.0 后的一个新功能版本,该版本引入了很多有价值的改进,完整的改动列表请参见release notes。在这里,我们将挑一些主要改进做说明。
Kylin 目前已经支持通过 JDBC 连接包括 Amazon Redshift, SQL Server 在内的多种数据源。
为了便于开发者更便利地处理各种 SQL 方言(dialect) 的不同,以更加简单地开发新的 JDBC 数据源,Kylin 提供了相应的 SDK 和统一的 API 入口:
* 同步元数据和数据 * 构建 Cube * 当找不到相应的 Cube 来解答查询时,下推查询到数据源
更多内容参见 KYLIN-3552。
在过去,Kylin 对查询结果的缓存不是十分高效,主要有以下两个方面的原因:
* 一个是当 Kylin 的 metadata 发生变化时,会主动盲目地去清除大量缓存,使得缓存会被频繁刷新而导致利用率降低。 * 另一点是由于只使用本地缓存而导致 Kylin server 之间不能共享彼此的缓存,这样查询的缓存命中率就会降低。
本地缓存的一个缺点是大小受到限制,不能像分布式缓存那样水平扩展。这样导致能缓存的查询结果量受到了限制。
针对这些缺陷,我们改变了缓存失效的机制,不再主动去清理缓存,而是采取如下的方案:
我们还引入了 Memcached 作为 Kylin 的分布式缓存。这样 Kylin server 之间可以共享查询结果的缓存,而且由于 Memcached server 之间的独立性,非常易于水平拓展,更加有利于缓存更多的数据。
相关开发任务是 KYLIN-2895, KYLIN-2894, KYLIN-2896, KYLIN-2897, KYLIN-2898, KYLIN-2899。
在过去进行 fast cubing 时,Kylin 使用自己定义的一系列线程,如 split 线程,task 线程,main 线程等等进行并发的 Cube 构建。
在这个线程模型中,线程之间的关系十分的复杂,而且对异常处理也十分容易出错。
现在我们引入了 ForkJoinPool,在主线程中处理 split 逻辑,构建 cuboid 的任务以及子任务都在 fork join pool中执行,cuboid 构建的结果可以被异步的收集并且可以更早地输出给下游的 merge 操作。
更多内容参见 KYLIN-2932。
对于 HLLCounter, 我们从两方面进行了改进:构建 HLLCounter 和计算调和平均的方式。
更多内容参见 KYLIN-3656。
在过去,cube planner 的 phase two 增加未被预计算的 cuboid 的方式只能通过 mandatory cuboid 的方式。而一个 cuboid 是否为 mandatory,又有两种方式:手动设置,或者查询时 rollup 的行数足够大。
这里通过判断查询时 rollup 的行数是否足够大来判断是否为 mandatory cuboid 的方式有两大缺陷: * 一是估算 rollup 的行数的算法不是很好 * 二是很难设立一个静态的阈值来做判定
现在我们不再从 rollup 行数的角度看问题了。一切都是从 cuboid 行数的角度看问题,这样就和 cost based 的 cube planner 算法做了统一。
为此我们通过使用 rollup 比率来改进了未被预先构建的 cuboid 的行数的估算,然后让 cost based 的 cube planner 算法来判定哪些未被构建的 cuboid 该被构建,哪些该被遗弃。
通过这样的改进,无需通过设定静态的阈值来推荐 mandatory cuboid 了,而 mandatory cuboid 只能被手动设置,不能被推荐了。
更多内容参见 KYLIN-3540。
要下载Apache Kylin v2.6.0源代码或二进制包,请访问下载页面:
Apache Kylin | Downloadkylin.apache.org
参考升级指南:
Upgrade From Old Versionskylin.apache.org
如果您遇到问题或疑问,请发送邮件至 Apache Kylin dev 或 user 邮件列表:
dev@kylin.apache.org,user@kylin.apache.org
在发送之前,请确保您已通过发送电子邮件至:
dev-subscribe@kylin.apache.org 或 user-subscribe@kylin.apache.org 订阅了邮件列表。
感谢 eBay 团队钟阳红(Apache Kylin Committer & PMC)撰稿!
9月8日,由数智猿×数据猿联合主办的“2025第五届数智化转型升级发展论坛——暨 AI 大模型 & A
全球权威的技术研究与咨询公司 Gartner 在其最新发布的《2024 年中国数据、分析及人工智能技术成熟度曲
7月28日下午,2025世界人工智能大会暨人工智能全球治理高级别会议闭幕式在上海世博中心银厅举行。跬智信息联合
7月18日,在由非凡产研主办的2025年度生成式 AI 全球化高峰论坛暨「Go Global AI 100」年
“一旦企业的数智化建设真正运行起来,好像都「顺」了。”这是跬智信息(Kyligence)在为中国新能源巨头车企
近日,The Channel Company® 旗下权威科技媒体 CRN® 正式发布了 2025 年“大数据1
跬智信息 Kyligence Zen 一站式指标平台 与 Kyligence AI 数智助理 2.0 近日顺利
5月27日,中国工人大思政课(第九站)“紧跟党的步伐 走在时代前列”——上海市经信系统青年职工理论学习分享会暨
随着大模型加速落地,企业正从“接入大模型”阶段,走向“构建业务型智能体”的深入实践。近日,中国信息通信研究院正
400 8658 757
工作日:10:00 - 18:00
已有账号? 点此登陆
预约演示,您将获得
完整的产品体验
从数据导入、建模到分析的全流程操作演示。
行业专家解惑
与资深行业专家的交流机会,解答您的个性化问题。
请填写真实信息,我们会在 1-2 个工作日内电话与您联系。
全行业落地场景演示
涵盖金融、零售、餐饮、医药、制造等多个行业,最贴合您的业务需求与场景。
Data + AI 应用落地咨询
与资深技术专家深入交流,助您的企业快速落地 AI 场景应用。
登记申请,确认后即可体验
超越普通人类专家的 AI 自主深度洞察
体验预置跨行业智能体模板,涵盖金融、零售、餐饮、医药、制造等多个行业,最贴合您的业务需求与场景。
超越大模型的精准数据计算能力
接入高精度数值计算大模型服务,为您的企业级 AI 应用提供强大支持。
Data + AI 落地应用咨询:
与资深专家深入探讨数据和 AI 如何帮助您的企业加速实现应用落地,构建更智能的数据驱动未来。
申请体验,您将获得
体验数据处理性能 2x 加速
同等规模资源、同等量级数据、同一套数据处理逻辑,处理耗时下降一半
专家支持
试用部署、生成数据、性能对比各操作环节在线支持