Kyligence Copilot - AI 数智助理,以 AI 变革企业经营与管理! 立即了解更多

【案例分享】Apache Kylin在国美在线的应用

路加
2016年 12月 10日

双十一每年都是检验各个公司技术平台实力的重要时刻,在今年,使用Apache Kylin构建的国美在线大数据查询系统稳定的支持了双十一3天的海量查询需求,“非常稳定的度过,数据查询上完全没掉链子”,国美在线大数据平台经理,路加评价道,在11月25-26日的World Of Tech 2016 大数据技术峰会上,路加进行了题为“Apache Kylin在国美在线的应用”的分享,介绍了Apache Kylin在国美的应用,选型过程及技术架构等,同时也分享了双十一三天的查询性能、热力图应用等内容,是非常不错的的Apache Kylin应用案例参考

Apache Kylin公众号近日也获得授权分享这则案例,希望对您有所帮助。

在此感谢路加先生的精彩分享。

讲师介绍

姓名:路加

职位:大数据平台部经理

公司:国美在线

简介:2012年硕士毕业于东北大学,曾在华为2012实验室-香浓实验室进行情景感知平台的研发工作,2014年加入国美在线,主要负责大数据平台的建设,目前重点关注在OLAP分析平台的开发和管理工作,助力公司的数据化运营。

国美大数据

国美大数据平台:

国美大数据平台架构:

大数据OLAP的挑战:

• 百亿级的数据规模

• 维度和指标的需求变化

• 问题数据修复

• 查询效率

Apache Kylin的引入

• 高效查询

• 保持现有组件

• JDBC接口

• 完整性组件

• 交互界面

Model & Cube:

Job Monitor:

Apache Kylin架构:

Apache Kylin基本原理:

Apache Kylin的OLAP分析平台实践

Cube优化:

• 减少膨胀率• 提高查询效率• 减少cube构建的时间

•Aggregation Groups

• Mandatory Dimensions

• Hierachy Dimensions

• Joint Dimensions

includes中的所有维度=

Mandatory Dimensions + Hierarchy Dimensions + Joint Dimensions

Apache Kylin的引入:

• Rowkey的顺序

• Segment合并

遇到的坑:

• Segment无法拆分

• 非星型模型的关联查询• 版本升级• Job Server单节点

Kylin待发展的方面:

• 高基维度的查询支持

• 丰富聚合函数

• 明细查询

• 非星型模型的支持

双11三天的查询统计:

全站热力图:

点击热力图:

总结

• Kylin的输入是星型模型

• Kylin暴露的是Hive的元数据

• Cube优化是用好Kylin的重点

添加企微

kyligence
关注我们

kyligence