Kyligence Copilot - AI 数智助理,以 AI 变革企业经营与管理! 立即了解更多
AI 数智助理
Kyligence Zen Kyligence Zen
Kyligence Enterprise Kyligence Enterprise
Kyligence Turbo Kyligence Turbo
指标平台解决方案
OLAP 解决方案
行业解决方案
客户总览
金融
零售
制造
医药
其他
云平台
BI
寻求合作
资源
Kyligence Enterprise
Kyligence Zen
培训
Apache Kylin
Byzer
Gluten
博客
关于
市场活动
Apache Kylin 是一个领先的开源分布式分析引擎,提供 Hadoop 之上超大规模的 SQL 查询接口及多维分析能力。在超大规模数据集上建立数据模型,构建支持多维分析的预计算 Cube,并开放通用的 ODBC、JDBC 或 Restful API 接口。这种独特的预计算 Cube 使 Apache Kylin 可以轻松应对超大数据集上的查询,并实现亚秒级响应。
Hue 是一个简单易用的 SQL 编辑器,提供基于 Web 的开源图形用户界面,方便用户查询基于 Hadoop 的相关服务。SQL 是分析师最熟悉的查询语言,因此 Hue 可帮助他们轻松访问 Hadoop 上的大数据。
在本文中,我们将介绍如何连接 Hue 与 Apache Kylin,快速实现分析海量数据。
准备 Hue 镜像
使用 Docker 拉取最新 Hue。
docker pull gethue/hue:latest
准备 Kylin JDBC 驱动程序
下载 Apache Kylin 安装包
wget -c https://mirror.bit.edu.cn/apache/kylin/apache-kylin-2.2.0/apache-kylin-2.2.0-bin-hbase1x.tar.gz
解压安装包
tar -zxvf apache-kylin-2.2.0-bin-hbase1x.tar.gz
使用 cp 命令复制 Kylin JDBC 驱动程序
cp apache-kylin-2.2.0-bin/lib/kylin-jdbc-2.2.0.jar .
hue$ ls
apache-kylin-2.2.0-bin apache-kylin-2.2.0-bin-hbase1x.tar.gz kylin-jdbc-2.2.0.jar
将 Hub 配置文件复制到主机
从 Docker 复制配置文件
docker run -it -d --name hue_tmp gethue/hue /bin/bash
cp hue_tmp:/hue/desktop/conf/pseudo-distributed.ini .
docker stop hue_tmp; docker rm hue_tmp
现在,在当前目录中可以看到 pseudo-distributed.ini文件。
在 pseudo-distributed.ini文件中配置Apache Kylin的连接。
vim pseudo-distributed.ini
将以下 Kylin 配置复制到该文件中,并根据你的Kylin集群信息修改具体的配置信息。
dbproxy_extra_classpath=/hue/kylin-jdbc-2.2.0.jar [[[kylin]]]
name=kylin JDBC
interface=jdbc
options='{"url": "jdbc:kylin://<your_host>:<port>/<project_name>","driver": "org.apache.kylin.jdbc.Driver", "user": "<username>", "password": "<password>"}'
例如,将以下配置添加到该文件中。
dbproxy_extra_classpath=/hue/kylin-jdbc-2.2.0.jar # One entry for each type of snippet.
[[interpreters]]
# Define the name and how to connect and execute the language.
[[[kylin]]]
options='{"url": "jdbc:kylin://localhost:7070/learn_kylin","driver": "org.apache.kylin.jdbc.Driver", "user": "ADMIN", "password": "KYLIN"}' [[[hive]]]
# The name of the snippet.
name=Hive
# The backend connection to use to communicate with the server.
interface=hiveserver2
编辑 Dockerfile。
touch Dockerfile
vim Dockerfile
将以下脚本粘贴到 Dockerfile 中
FROM gethue/hue:latest
COPY ./kylin-jdbc-2.2.0.jar /hue/kylin-jdbc-2.2.0.jar
COPY ./pseudo-distributed.ini /hue/desktop/conf/pseudo-distributed.ini
EXPOSE 8888
此配置会将 Kylin JDBC Jar 和 pseudo-distributed.ini 复制到 Docker 的 Hue 中。并在 Docker中暴露端口 8888。
构建并启动 Docker 容器
docker build -t hue-demo -f Dockerfile .
docker run -itd -p 8888:8888 --name hue hue-demo
Hue 已准备就绪,并在 localhost:8888 上运行。
现在可以从 Hue 中查询 Apache Kylin 的数据了。
在 AWS 上部署 Apache Kylin 和 Hue
下面我们将引导您在 AWS EMR 上部署 Apache Kylin 和 Hue。
在 AWS EMR 上安装 Apache Kylin
有关如何在 AWS EMR 上安装 Apache Kylin 的信息,可参考此文 。
在已配置 Apache Kylin 的 AWS EMR 上安装 Hue
在 AWS EMR 上安装 Apache Kylin 后,可使用 bootstrap 文件在已配置Apache Kylin 的 AWS EMR 上轻松部署 Hue。
请确保转义符与以下 json 中保持一致。
[
{
"Classification": "hue-ini",
"Properties": {},
"Configurations": [
"Classification": "notebook",
"Properties": {
"dbproxy_extra_classpath": "/opt/kylin_jdbc/kylin-jdbc-2.2.0.jar"
},
"Classification": "interpreters",
"Classification": "kylin",
"name": "kylin JDBC",
"interface": "jdbc",
"options": "{\"url\": \"jdbc:kylin://<host>:<port>/<project>\", \"driver\": \"org.apache.kylin.jdbc.Driver\", \"user\": \"<username>\", \"password\": \"<password>\"}"
"Configurations": []
}
]
aws emr create-cluster --name "HUE Cluster" --release-label emr-5.10.0 \
--ec2-attributes KeyName=<keypair_name>,InstanceProfile=EMR_EC2_DefaultRole,SubnetId=<subnet_id> \
--service-role EMR_DefaultRole \
--applications Name=Hive Name=Hue Name=Pig \
--emrfs Consistent=true,RetryCount=5,RetryPeriod=30 \
--instance-count 1 --instance-type m3.xlarge \
--configurations file://configurations.json \
--bootstrap-action Path="s3://<your_bucket>/download.sh"
3. 集群状态变为 “Waiting” 后,在 Web 浏览器中输入 https://<public_dns_of_master>:8888,可以看到含 Hue 的集群已准备就绪。
在本文中,我们演示了如何轻松配置 Hue 来查询 Apache Kylin 中的数据。Hue 是一款便捷易用的开源 SQL 编辑器,可帮助您分析Apache Kylin 等基于Hadoop的服务的数据。Hue 和 Apache Kylin 均可在本地或云端部署,便于在任何地方组合使用。
01 现象 社区小伙伴最近在为 Kylin 4 开发 Soft Affinity + Local Cache
01 背景 随着顺丰末端物流(末端物流主要分为对小哥、柜机、区域等的资源的管理和分批;对路径、排班、改派等信息
Apache Kylin 的今天 目前,Apache Kylin 的最新发布版本是 4.0.1。Apache
Kylin 入选《上海市重点领域(金融类)“十四五”紧缺人才开发目录》 数字经济已成为全球增长新动
在 Kyligence 主办的 Data & Cloud Summit 2021 行业峰会的「数字化转
近日由 Kyligence 主办的 Data & Cloud Summit 2021 行业峰会在上海成
近五年来,Kyligence 服务了金融、制造、零售、互联网等各个行业的龙头企业,我们在服务这些企业的过程中,
2021年1月14日,Kyligence 产品经理陈思捷开启了我们在 2021 年的首场线上分享,为大家介绍了
400 8658 757
工作日:10:00 - 18:00
已有账号? 点此登陆
预约演示,您将获得
完整的产品体验
从数据导入、建模到分析的全流程操作演示。
行业专家解惑
与资深行业专家的交流机会,解答您的个性化问题。
请填写真实信息,我们会在 1-2 个工作日内电话与您联系。
全行业落地场景演示
涵盖金融、零售、餐饮、医药、制造等多个行业,最贴合您的业务需求与场景。
Data + AI 应用落地咨询
与资深技术专家深入交流,助您的企业快速落地 AI 场景应用。
申请体验,您将获得
体验数据处理性能 2x 加速
同等规模资源、同等量级数据、同一套数据处理逻辑,处理耗时下降一半
专家支持
试用部署、生成数据、性能对比各操作环节在线支持