Apache Kylin 社区于日前宣布:Apache Kylin v4.0.0-alpha 正式发布!欢迎大家下载使用。
Apache Kylin 是一个开源的分布式分析引擎,提供 Hadoop/Spark 之上的 SQL 查询接口及多维分析 (OLAP) 能力,支持对超大规模数据进行亚秒级查询,已被 eBay、腾讯、美团点评、滴滴、OLX 集团等全球上千家企业采用。
Release Notes
Apache Kylin v4.0.0-alpha 是继 Kylin 3 之后的一个重大架构升级版本,Kylin 4 使用 Parquet 这种真正的列式存储来代替 HBase 存储,从而提升文件扫描性能;同时,Kylin 4 重新实现了基于 Spark 的构建引擎和查询引擎,使得计算和存储的分离变为可能,更加适应云原生的技术趋势。
当前的 v4.0.0-alpha 是 Kylin 4 的第一个发布的早期预览版本,目前仍有部分功能在开发完善中,后续我们会持续更新和发布新版本,欢迎大家多多参与体验和讨论。本次发布共添加了 35 个新功能,修复了 22 个问题,详情请访问这里。
重要更新:
[KYLIN-4213] - 通过 SparkSQL 实现构建引擎
[KYLIN-4450] - 为构建引擎添加 Spark 参数自动设置功能
[KYLIN-4458] - 通过 FilePruner 来进行文件剪枝
[KYLIN-4662] - 从第三方 Spark 迁移到 Apache Spark
[KYLIN-4475] - 为 Kylin 4 支持 intersect_count
[KYLIN-4475] - 为 Kylin 4 支持 Count Distinct, TopN
[KYLIN-4713] - 查询可以支持不同的 spark.schedule.pool
[KYLIN-4701] - 前端升级
[KYLIN-4644] - 升级垃圾清理工具
相关文档请参考这里。
下载
下载 Apache Kylin v4.0.0-alpha 源代码及二进制安装包,请访问下载页面
体验
当前 Kylin 4.0.0-alpha 的 Docker 容器已经发布,用户无需安装 Hadoop,可以通过以下命令来在笔记本上体验 Kylin 4:
docker run -d -m 8G -p 7070:7070 -p 8088:8088 -p 50070:50070 \ -p 8032:8032 -p 8042:8042 -p 2181:2181 \
apachekylin/apache-kylin-standalone:4.0.0-alpha
介绍视频
Kylin 4.0 是 Kylin 社区继 Kylin 3 系列后的一个重大的版本更新,它采用了全新的 Spark 构建引擎和 Parquet 存储,从去年开始就在社区收到了非常多期待的声音。关于 Kylin 4 的一些新特性的详细介绍和使用体验上的注意事项,详请观看视频。
升级
升级至 Apache Kylin v4.0.0-alpha 版本,请参见升级指南
反馈
如果您遇到疑问或问题,请发送邮件至 Apache Kylin user 或 dev 邮件列表:
user@kylin.apache.org
dev@kylin.apache.org
注意:该邮件列表需要订阅才能使用。如未订阅该邮件列表,请先发送邮件至 user-subscribe@kylin.apache.org 或 dev-subscribe@kylin.apache.org,并回复确认完成订阅。
社区贡献者
感谢所有参与 Kylin v4.0.0-alpha 版本设计、开发、测试、讨论的社区贡献者们(注:以下名单按照 Jira ID 首字母排序,不分先后):harveyyue, Jiatao Tao, kaiqi.xue, mingming.ge, nichunen, Pan Wang, RupengWang, Sean-Gu, sunbiaobiao, XiaoxiangYu, YaqianZhang, Yifei.Wu, yiming.xu, Yongheng.Liu, ZhichaoZhang.