博客 > 技术博客

What's new about Apache Kylin v3.0.0-alpha

2019年 4月 18日

Apache Kylin v3.0.0-alpha 正式发布！欢迎大家下载使用。在这个版本中，值得关注的是：

3.0.0-alpha 增加了对流式数据源进行实时查询的能力，详情可以查看KYLIN-3654；
在KYLIN-3795中，我们使用Livy Rest API提交Spark Job，从而免除本地安装Spark客户端配置的麻烦；
KYLIN-3820增加了新的基于Zookeeper的作业调度器。

Apache Kylin 是一个开源的分布式分析引擎，提供 Hadoop 之上的 SQL 查询接口及多维分析（OLAP）能力，支持对超大规模数据进行亚秒级查询。

关于Release Notes

Apache Kylin v3.0.0-alpha 是继 v2.6 版本后的一次重大更新，详情请访 release notes 链接。

重要特性

[KYLIN-3654] - Kylin Real-time Streaming

借助新增加了Receiver集群，Kylin实现了毫秒级别的数据准备延迟，可以实时查询来自Kafka数据源的消息，点击了解关于如何在本地运行

[KYLIN-3795] - Submit Spark jobs via Apache Livy

Spark 作业的提交通过RestAPI来向Livy Server提交，而无需在本地启动Spark Driver进程，从而方便对Spark资源的管理监控，同时也降低对Kylin进程所在节点的压力。

[KYLIN-3716] - FastThreadLocal replaces ThreadLocal

使用FastThreadLocal替代ThreadLocal，可以一定程度上提升Kylin的整体性能。

[KYLIN-3867] - Enable JDBC to use key store & trust store for https connection

通过使用HTTPS，保护了JDBC使用的身份验证信息，使得Kylin更加安全。

[KYLIN-3905] - Enable shrunken dictionary default

默认开启shrunken dictionary，针对高基维进行精确去重的场景，可以显著减少构建用时。

[KYLIN-3820] - Add a curator-based job scheduler

新增一种作业调度器，可以自动发现Job节点，并且可以实现自动故障恢复。

[KYLIN-3839] - Storage clean up after the refreshing and deleting a segment

更加及时地清除不必要的数据文件

故障修复

[KYLIN-3800] - Real-time streaming count distinct result wrong

修复了Realtime OLAP精确去重结果不正确的问题

[KYLIN-3759] - Streaming ClassNotFoundExeception when lambda is enable in MR job

修复了Realtime OLAP lambda不能正确构建segment的问题

[KYLIN-3821] - Expose real-time streaming data consuming lag info

使得Realtime OLAP 可以显示当前消费滞后的情况

[KYLIN-3909] - Spark cubing job failed for MappeableRunContainer is not registered

修复了Spark Cubing中精确去重出现的缺少类注册的问题。

[KYLIN-3916] - Fix cube build action issue after streaming migrate

修复合并Realtime OLAP这部分代码后，前端无法显示cube操作的问题

关于下载

下载 Apache Kylin v3.0.0-alpha 源代码及二进制安装包，请访问下载页面：

关于升级

升级至 ApacheKylin v3.0.0-alpha 版本，请参见升级指南：

关于支持

升级和使用过程中有任何问题，请提交至 Kylin 的JIRA:

或发送邮件至 Apache Kylin 邮件列表：user@kylin.apache.org

What's new about Apache Kylin v3.0.0-alpha

2025，再谈 AI 时代下数据语义层的价值

谁为 Data Agent “买单”？

服务手记丨国有大行如何在信创大数据平台上，跑通“全场景 OLAP ”？

攻略丨搭建属于自己的 DeepSeek，本地部署「手搓教程」在此！

码上时刻｜通过逻辑视图 Logic View 快速实现批流一体

头部银行 AI 落地实践｜数据应用赋能经营管理闭环

精准铺货、动态调整，指标平台让零售饮料企业掌握线下渠道主动权

把简单留给用户，把复杂交给 AI

头部房企｜数据驱动工程精细化运营，稳中提效

What's new about Apache Kylin v3.0.0-alpha

您可能会感兴趣

阅读下一篇

2025，再谈 AI 时代下数据语义层的价值

谁为 Data Agent “买单”？

服务手记丨国有大行如何在信创大数据平台上，跑通“全场景 OLAP ”？

攻略丨搭建属于自己的 DeepSeek，本地部署「手搓教程」在此！

码上时刻｜通过逻辑视图 Logic View 快速实现批流一体

头部银行 AI 落地实践｜数据应用赋能经营管理闭环

精准铺货、动态调整，指标平台让零售饮料企业掌握线下渠道主动权

把简单留给用户，把复杂交给 AI

头部房企｜数据驱动工程精细化运营，稳中提效