Kyligence AI 服务 - 让大模型完成准确、可靠的数值计算和回答! 立即了解更多
AI 数智助理
Kyligence Zen Kyligence Zen
Kyligence Enterprise Kyligence Enterprise
Kyligence Turbo Kyligence Turbo
指标平台解决方案
OLAP 解决方案
行业解决方案
客户总览
金融
零售
制造
医药
其他
云平台
BI
寻求合作
资源
Kyligence Enterprise
Kyligence Zen
培训
Apache Kylin
Byzer
Gluten
博客
关于
市场活动
在近期的Apache Kylin Innovation Meetup 上,Kyligence的技术合伙人兼生态合作技术总监李栋,与大家分享了Kylin的最新数据源开发功能。从Apache Kylin v1.6版本开始,Apache Kylin增加了对Kafka数据源的支持,打开了流式OLAP分析的大门。同时,随着越来越多的企业用户期望把传统数仓、数据库的数据也接入Apache Kylin做分析,从Apache Kylin v2.1版本开始支持JDBC数据源,满足用户对SQL on Hadoop、RDBMS等数据源中的数据进行OLAP分析探索的需求。
但是,JDBC数据源各不相同,想要深度实现某种数据源的对接,需要开发者投入大量精力对数据源做适配。因此Apache Kylin v2.6推出了Data Source SDK的功能,可以帮助开发者快速开发JDBC数据源的适配,实现新数据源的对接。
这套SDK是用于帮助开发者提高开发效率而生的,开发者可以使用这套Data Source SDK为某种数据源开发一个Adaptor,从而实现Apache Kylin从数据源中同步表、构建Cube、查询下压的需求。下图中黄色菱形块所示即为Data Source SDK提供的扩展接口。
首先,拿元数据同步来讲,标准的JDBC接口就实现了获取数据库、表、列的API。但不同数据库的实现方式可能不同,以及某些开发者不希望把系统库、系统表暴露给分析师,这些需求都可以在Adaptor中实现。
JDBC数据源构建的过程如下图所示,依赖sqoop在数据源中执行打平表的任务,然后把数据传送到Hadoop集群,然后通过一系列MapReduce或Spark任务执行后续构建任务。Adaptor在构建过程的主要作用是,将Apache Kylin产生的打平表SQL语句转化为数据源可支持的SQL方言。
在查询下压也是类似。Apache Kylin支持将无法命中Cube的查询路由到数据源引擎中执行,然后把结果返回给用户。Adaptor在查询下压中的过程也是实现SQL方言转换,把用户输入的SQL语句从Apache Kylin的SQL方言转换为底层数据源引擎的SQL方言。
如下图所示,Data Source SDK实际为一组函数接口的集合,开发者只需按照数据源的特性,开发响应接口的实现即可。
默认的,Data Source SDK中自带了一个默认实现,基于这套默认实现,开发者仅通过添加一个XML格式的配置转换模板,即可完成某个数据源Adaptor的开发。
如下图所示,就是一个数据源的配置转换模板,模板中定义了对于特定SQL语法的配置、函数表达式和数据类型的表达方式。开发者只需按照这些配置项,根据数据源特性填写相应的配置,即可快速开发出一个新的数据源。如果有没有被该模板覆盖的需求,开发者依然可以重写接口函数,对默认实现进行扩展。
有了Data Source SDK的功能之后,Apache Kylin可以支持更加广泛的数据源,为企业进行大数据平台架构优化也带来了更多可能。
以前,报表等数据分析应用需要按场景对接多种底层技术,如多维分析对接Apache Kylin,灵活分析对接SQL on Hadoop;
现在,企业可以把Apache Kylin架构为统一的大数据OLAP平台,为BI应用提供统一的数据出口,简化系统架构和开发难度。
如上图右侧所示,我们使用Tableau报表做了测试:同样的报表在查询下压和访问Cube两种模式下执行,均能正常渲染,且无需修改报表内容,同时获得14倍的效率提升,可以有效帮助企业用户实现数据分析从传统技术向大数据平台的迁移。
本文仅对Data Source SDK的功能、框架做了简要介绍,如果您想了解更加深入的技术细节,请参考以下链接:
http://kylin.apache.org/development/datasource_sdk.html
http://kylin.apache.org/blog/2019/01/16/introduce-data-source-sdk-v2.6.0
01 现象 社区小伙伴最近在为 Kylin 4 开发 Soft Affinity + Local Cache
01 背景 随着顺丰末端物流(末端物流主要分为对小哥、柜机、区域等的资源的管理和分批;对路径、排班、改派等信息
Apache Kylin 的今天 目前,Apache Kylin 的最新发布版本是 4.0.1。Apache
Kylin 入选《上海市重点领域(金融类)“十四五”紧缺人才开发目录》 数字经济已成为全球增长新动
在 Kyligence 主办的 Data & Cloud Summit 2021 行业峰会的「数字化转
近日由 Kyligence 主办的 Data & Cloud Summit 2021 行业峰会在上海成
近五年来,Kyligence 服务了金融、制造、零售、互联网等各个行业的龙头企业,我们在服务这些企业的过程中,
2021年1月14日,Kyligence 产品经理陈思捷开启了我们在 2021 年的首场线上分享,为大家介绍了
400 8658 757
工作日:10:00 - 18:00
已有账号? 点此登陆
预约演示,您将获得
完整的产品体验
从数据导入、建模到分析的全流程操作演示。
行业专家解惑
与资深行业专家的交流机会,解答您的个性化问题。
请填写真实信息,我们会在 1-2 个工作日内电话与您联系。
全行业落地场景演示
涵盖金融、零售、餐饮、医药、制造等多个行业,最贴合您的业务需求与场景。
Data + AI 应用落地咨询
与资深技术专家深入交流,助您的企业快速落地 AI 场景应用。
立即预约,您将获得
精准数据计算能力:
接入高精度数值计算大模型服务,为您的企业级AI应用提供强大支持。
个性化业务场景解决方案:
量身定制的计算模型和数据分析服务,切实贴合您的业务需求和应用场景。
Data + AI 落地应用咨询:
与资深专家深入探讨数据和 AI 如何帮助您的企业加速实现应用落地,构建更智能的数据驱动未来。
申请体验,您将获得
体验数据处理性能 2x 加速
同等规模资源、同等量级数据、同一套数据处理逻辑,处理耗时下降一半
专家支持
试用部署、生成数据、性能对比各操作环节在线支持