What's new about Apache Kylin v3.0.0-alpha

2019年 4月 18日

Apache Kylin v3.0.0-alpha 正式发布!欢迎大家下载使用。在这个版本中,值得关注的是:

  • 3.0.0-alpha 增加了对流式数据源进行实时查询的能力,详情可以查看KYLIN-3654;
  • 在KYLIN-3795中,我们使用Livy Rest API提交Spark Job,从而免除本地安装Spark客户端配置的麻烦;
  • KYLIN-3820增加了新的基于Zookeeper的作业调度器。

Apache Kylin 是一个开源的分布式分析引擎,提供 Hadoop 之上的 SQL 查询接口及多维分析(OLAP)能力,支持对超大规模数据进行亚秒级查询。

关于Release Notes

Apache Kylin v3.0.0-alpha 是继 v2.6 版本后的一次重大更新,详情请访 release notes 链接。

重要特性

[KYLIN-3654] - Kylin Real-time Streaming

借助新增加了Receiver集群,Kylin实现了毫秒级别的数据准备延迟,可以实时查询来自Kafka数据源的消息,点击了解关于如何在本地运行

[KYLIN-3795] - Submit Spark jobs via Apache Livy

Spark 作业的提交通过RestAPI来向Livy Server提交,而无需在本地启动Spark Driver进程,从而方便对Spark资源的管理监控,同时也降低对Kylin进程所在节点的压力。

[KYLIN-3716] - FastThreadLocal replaces ThreadLocal

使用FastThreadLocal替代ThreadLocal,可以一定程度上提升Kylin的整体性能。

[KYLIN-3867] - Enable JDBC to use key store & trust store for https connection

通过使用HTTPS,保护了JDBC使用的身份验证信息,使得Kylin更加安全。

[KYLIN-3905] - Enable shrunken dictionary default

默认开启shrunken dictionary,针对高基维进行精确去重的场景,可以显著减少构建用时。

[KYLIN-3820] - Add a curator-based job scheduler

新增一种作业调度器,可以自动发现Job节点,并且可以实现自动故障恢复。

[KYLIN-3839] - Storage clean up after the refreshing and deleting a segment

更加及时地清除不必要的数据文件

故障修复

[KYLIN-3800] - Real-time streaming count distinct result wrong 

修复了Realtime OLAP精确去重结果不正确的问题

[KYLIN-3759] - Streaming ClassNotFoundExeception when lambda is enable in MR job

修复了Realtime OLAP lambda不能正确构建segment的问题

[KYLIN-3821] - Expose real-time streaming data consuming lag info

使得Realtime OLAP 可以显示当前消费滞后的情况

[KYLIN-3909] - Spark cubing job failed for MappeableRunContainer is not registered

修复了Spark Cubing中精确去重出现的缺少类注册的问题。

[KYLIN-3916] - Fix cube build action issue after streaming migrate

修复合并Realtime OLAP这部分代码后,前端无法显示cube操作的问题

关于下载

下载 Apache Kylin v3.0.0-alpha 源代码及二进制安装包,请访问下载页面:

关于升级

升级至 ApacheKylin v3.0.0-alpha 版本,请参见升级指南:

关于支持

升级和使用过程中有任何问题,请提交至 Kylin 的JIRA:

或发送邮件至 Apache Kylin 邮件列表:user@kylin.apache.org

申请试用
关注我们