Kyligence DeepInsight AI 深度洞察 - 首个企业级自主深度推理和洞察产品发布 立即了解更多

快速上手:在 Azure 上部署 Kyligence Cloud 3.X

本文将为您介绍如何在 Azure 平台上快速上手 Kyligence Cloud。

本文将为您介绍如何在 Azure 平台上快速上手 Kyligence Cloud。推荐您使用 Chrome (64.0.* 或更高版本) 浏览器来进行接下来的操作。

前期准备

Kyligence Cloud 使用应用注册功能获得操作授权以操作您的云资源,请参考准备部署的账号和资源完成账号、权限和前期资源的准备。

部署 Kyligence Cloud 服务

  1. 前往 Kyligence Cloud 自动部署引导页面,选择您需要部署的云平台,然后单击 下一步 按钮。本例中我们以 Microsoft Azure 为例。

  2. 填写您在Azure 平台准备部署账号和资源章节中创建的目录(租户)ID应用程序(客户端)ID应用程序密码 ,然后单击 下一步 按钮。

  3. 在部署基本信息页面,您需要提供以下信息:

    • 部署区域:根据您的需要,选择部署 Kyligence Cloud 服务的区域
    • 资源组: 选择您在 Azure 控制台创建的资源组
    • 资源标识名称: 识别您所部署的 Kyligence Cloud 及相关资源
    • 虚拟机类型: 部署 Kyligence Cloud 管理节点的虚拟机型号
    • 虚拟机 SSH 用户名: 远程登录部署 Kyligence Cloud 服务虚拟机的用户名
    • 虚拟机 SSH 密码: 远程登录部署 Kyligence Cloud 服务虚拟机的密码
    • Azure Database for MySQL 类型:选择保存 Kyligence Cloud 元数据的数据库类型和配置
    • 如何访问 Kyligence Cloud:
      • 使用公有网络访问:如您选择公有网络访问,Kyligence Cloud 服务将会配置公有网络负载均衡,您需要填写一个可访问此公有网络负载均衡的 CIDR 地址,如需配置多个 CIDR,请参考Kyligence Cloud 安全组配置文档,前往 Azure 门户,前往 Kyligence Cloud 的网络安全组手动添加入站规则。
      • 使用私有网络访问:如您选择私有网络访问,Kyligence Cloud 服务将不会配置公有网络负载均衡,仅会配置私有网络负载均衡,您需要确保您能连接到此私有网络。
  4. (非必须)点击 下一步 可选择为 Kyligence Cloud 部署的资源创建标签,点击 添加标签 进行添加。 或跳过此步骤直接点击 部署 即启动部署,并跳转至部署过程的进度页面。

    Kyligence Cloud 将在您所选资源组内自动创建所需的资源和服务,整个过程大概需要 20 分钟左右,具体时间可能因不同服务环境的网络条件有所偏差。

  5. 部署成功后点击页面上的 Kyligence Cloud 服务地址,即可进入 Kyligence Cloud 主页面。首次进入会提示您输入 Kyligence Cloud 许可证,请上传您的 License 文件。

    如果您是首次试用 Kyligence Cloud, 您可以在 Kyligence 官网 申请试用 License,然后在试用欢迎邮件中下载您的试用 License 文件。

  6. 输入下列初始用户名和密码,登录 Kyligence Cloud 。登录后建议您立即修改登录密码。
    • 用户名:ADMIN
    • 密码:KYLIN

创建工作区

部署了 Kyligence Cloud 之后,您需要创建一个工作区,用于连接数据源及加速查询。

您需要在创建工作区页面输入以下信息:

  • 工作区名称:请输入工作区名称
  • 数据源类型:
    • 您可以选择 Azure Data Lake Storage Gen 2 ,然后填写存储账户名称、存储账户密钥。关于如何获取存储账户名称及存储账户密钥,请参考工作区管理
    • 您可以选择 Azure Blob Storage ,然后填写存储账户名称、存储账户密钥。关于如何获取存储账户名称及存储账户密钥,请参考工作区管理
    • 您可以选择 Snowflake ,输入用户名、密码及 JDBC 连接串信息,例如:
      jdbc:snowflake://demo.snowflakecomputing.com/?db=demo&warehouse=demo
      
    • 您可以选择 Azure Synapse Analytics ,输入用户名、密码及 JDBC 连接串信息,例如:
      区域为 china :
      
      jdbc:sqlserver://demo.database.chinacloudapi.cn:1433;database=demo;
      
      区域为 global :
      
      jdbc:sqlserver://demo.database.windows.net:1433;database=demo;
      
    • 查询引擎 SSH 密钥:请创建用来访问您的 Kyligence Cloud 的查询引擎的 SSH 密钥
    • (非必须)资源标签:此处可为此工作区创建的资源添加标签,以便于您的云平台管理员对云上资源进行管理,默认地创建 Kyilgence Cloud 时添加的标签会自动添加到此工作区的资源上,您也可以对已有的标签进行修改或者添加新的标签。
    • 集群配置:请输入您的总加载数据量,Kyligence Cloud 将为您推荐集群配置,您可以点击“启用自定义配置”来调整集群配置

      填写完表单审核+创建按钮,Kyligence Cloud 将自动创建 Spark 集群,创建过程大约需要 5-10 分钟

创建项目

工作区创建完成后,您需要在工作区内创建项目。您可以在一个工作区内创建多个项目,共享集群资源并服务于不同的业务范围。

导入样例数据

本功能在 Azure 平台当前仅支持 Azure Data Lake Storage Gen 2 和 Azure Blob Storage 数据源,如果您使用 Azure Synapse Analytics 或 Snowflake 作为数据源,请参考 数据源 文档添加数据源

Kyligence Cloud 内置了 NYC_Taxi 数据集,包含了绿色出租车 2019 年 1 月份的出行数据。在本例中,使用此数据集进行分析。在工作区列表点击进入已创建好的工作区,选中左侧 数据源-创建表 菜单,点击 创建表 按钮,在添加表页面选择 导入样例表,点击 立即导入 按钮进行模型的导入。关于样例模型的说明及数据字典,请参考样例模型

当页面中出现"导入成功"的提示后,请打开模型界面,您可以看到 nyc_taxi_green_trip 即为导入的样例模型。

如果您需要使用样例表进行建模,请参考模型章节来创建模型

为了加速查询,请您单击 nyc_taxi_green_trip 模型下方的 聚合索引页面中的 构建索引 按钮,为模型加载数据,用于接下来的分析。

首次构建数据大概需要 5-8 分钟,您可以点击左侧导航栏中的 任务 页面查询进度,构建完成后即可使用该数据集进行分析。

点击左侧导航栏中的 查询,使用 SQL 进行数据查询。

分析数据

Kyligence Cloud 内置一个可视化分析工具 Kyligence Insight,本节以 Kyligence Insight 为例介绍数据分析的过程,具体步骤如下:

安装并启动 Kyligence Insight

在 连接 BI 页面点击连接内置的 Kyligence Insight 下方的 安装并启动,等待安装后打开 Kyligence Insight。

创建数据集

  1. 新建数据集:选择 sample 项目,进入数据集页面。然后点击左上角的 +数据集 按钮,并选择数据集用途为 SQL数据集
  2. 定义数据集:首先在 基本信息 中输入数据集名称为 “Nyc_Taxi”,点击下一步。在 定义关系 中将所需的模型拖拽到右侧,然后点击下一步
  3. 定义语义:在 定义语义 中,您可以进行如下定义:
    • 点击维度名称右侧的编辑按钮,以更改维度名称,例如,将 GREEN_TRIP_DATA 表中的 PICKUP_DATETIME 重命名为“上车时间”

  • 点击度量名称的编辑按钮,以更改度量名称

    在所有的定义完成之后,点击右下角的保存按钮即可保存新建的数据集。

创建分析图表

点击导航栏中的 图表,然后点击左上角的 +图表 按钮,选择新建的 “Nyc_Taxi” 数据集,点击 确认 ,进入分析界面

拖拽所需的维度和度量到右侧,然后点击左上角的运行查询,即可运行查询,得到分析图表

例如,首先点击页面中的切换可视化类型按钮,选择可视化类型为“柱状图”。将“PYAMENT_TYPE_TYPE”拖入到维度中,将”GREEN_TRIP_DATA_TOTAL_AMOUNT_SUM”拖入到度量中,即可得到每个类型对应的订单金额总数

得到分析结果集之后,您可以点击页面中的 保存 按钮以保存您的图表,也可以点击右上角的 导出CSV 按钮,将查询结果集下载到本地。

即刻体验产品与服务

申请演示 联系我们

添加企微

kyligence
关注我们

kyligence