拥抱云原生:Apache Kylin v4.0.0-alpha 正式发布!

2020年 10月 09日

Apache Kylin 社区于日前宣布:Apache Kylin v4.0.0-alpha 正式发布!欢迎大家下载使用。

Apache Kylin 是一个开源的分布式分析引擎,提供 Hadoop/Spark 之上的 SQL 查询接口及多维分析 (OLAP) 能力,支持对超大规模数据进行亚秒级查询,已被 eBay、腾讯、美团点评、滴滴、OLX 集团等全球上千家企业采用。

Release Notes

Apache Kylin v4.0.0-alpha 是继 Kylin 3 之后的一个重大架构升级版本,Kylin 4 使用 Parquet 这种真正的列式存储来代替 HBase 存储,从而提升文件扫描性能;同时,Kylin 4 重新实现了基于 Spark 的构建引擎和查询引擎,使得计算和存储的分离变为可能,更加适应云原生的技术趋势。


当前的 v4.0.0-alpha 是 Kylin 4 的第一个发布的早期预览版本,目前仍有部分功能在开发完善中,后续我们会持续更新和发布新版本,欢迎大家多多参与体验和讨论。本次发布共添加了 35 个新功能,修复了 22 个问题,详情请访问这里

重要更新:

[KYLIN-4213] - 通过 SparkSQL 实现构建引擎

[KYLIN-4450] - 为构建引擎添加 Spark 参数自动设置功能

[KYLIN-4458] - 通过 FilePruner 来进行文件剪枝

[KYLIN-4662] - 从第三方 Spark 迁移到 Apache Spark

[KYLIN-4475] - 为 Kylin 4 支持 intersect_count

[KYLIN-4475] - 为 Kylin 4 支持 Count Distinct, TopN

[KYLIN-4713] - 查询可以支持不同的 spark.schedule.pool

[KYLIN-4701] - 前端升级

[KYLIN-4644] - 升级垃圾清理工具

相关文档请参考这里

下载

下载 Apache Kylin v4.0.0-alpha 源代码及二进制安装包,请访问下载页面

体验

当前 Kylin 4.0.0-alpha 的 Docker 容器已经发布,用户无需安装 Hadoop,可以通过以下命令来在笔记本上体验 Kylin 4:

docker run -d -m 8G -p 7070:7070 -p 8088:8088 -p 50070:50070 \      -p 8032:8032 -p 8042:8042 -p 2181:2181 \         
apachekylin/apache-kylin-standalone:4.0.0-alpha


介绍视频

Kylin 4.0 是 Kylin 社区继 Kylin 3 系列后的一个重大的版本更新,它采用了全新的 Spark 构建引擎和 Parquet 存储,从去年开始就在社区收到了非常多期待的声音。关于 Kylin 4 的一些新特性的详细介绍和使用体验上的注意事项,详请观看视频。

升级

升级至 Apache Kylin v4.0.0-alpha 版本,请参见升级指南

反馈

如果您遇到疑问或问题,请发送邮件至 Apache Kylin user 或 dev 邮件列表:

user@kylin.apache.org

dev@kylin.apache.org

注意:该邮件列表需要订阅才能使用。如未订阅该邮件列表,请先发送邮件至 user-subscribe@kylin.apache.org 或 dev-subscribe@kylin.apache.org,并回复确认完成订阅。

社区贡献者

感谢所有参与 Kylin v4.0.0-alpha 版本设计、开发、测试、讨论的社区贡献者们(注:以下名单按照 Jira ID 首字母排序,不分先后):harveyyue, Jiatao Tao, kaiqi.xue, mingming.ge, nichunen, Pan Wang, RupengWang, Sean-Gu, sunbiaobiao, XiaoxiangYu, YaqianZhang, Yifei.Wu, yiming.xu, Yongheng.Liu, ZhichaoZhang.