Kyligence DeepInsight AI 深度洞察 - 首个企业级自主深度推理和洞察产品发布立即了解更多

快速上手：在 AWS 上部署 Kyligence Cloud 3.X

本文将为您介绍如何在 AWS 平台上快速上手 Kyligence Cloud。

立即部署

本文将为您介绍如何在 AWS 平台上快速上手 Kyligence Cloud。推荐您使用 Chrome (64.0.* 或更高版本) 浏览器来进行接下来的操作。

前期准备

Kyligence Cloud 需要通过授权以操作您的云资源，请参考准备部署的账号和资源完成账号、权限等前期资源的准备。

部署 Kyligence Cloud 服务

1.前往 Kyligence Cloud 部署引导页面，选择合适的云平台。

如果您在使用由光环新网运营的 AWS 宁夏区域，或是由西云数据运营的 AWS 北京区域，请您选择 AWS China；如果您在使用其他区域，请选择 AWS Global。

2.在授权信息页面输入以下信息：

部署地区：选择部署 Kyligence Cloud 服务的 AWS 区域
选择以下验证方法之一进行角色验证
- IAM 角色（推荐）
- AWS 访问密钥

3.在基本信息页面输入以下信息：

创建堆栈名称：我们将使用 AWS 堆栈服务进行部署，请输入该堆栈的名称
EC2 机型：选择部署 Kyligence Cloud 服务的 EC2 机型
密钥对：选择远程访问 Kyligence Cloud 服务的 EC2 机型的 SSH 密钥
RDS 类型：选择保存 Kyligence Cloud 元数据的数据库类型
访问规则：配置可访问 Kyligence Cloud 服务的 IP 范围，如需配置多个 CIDR，请参考 Kyligence Cloud 安全组配置文档，前往 AWS 控制台，前往 Kyligence Cloud 实例的安全组手动添加入站规则。

4.（非必须）可选择为 Kyligence Cloud 部署的资源创建标签，以便于平台管理员进行管理，点击添加标签进行添加，标签可让您按各种标准 (例如用途、所有者或环境) 对 AWS 资源进行分类。这在您具有相同类型的很多资源时会很有用 — 您可以根据分配给资源的标签快速识别特定资源。我们建议您针对每类资源设计一组标签，以满足您的需要。使用一组连续的标签键，管理资源时会更加轻松。您可以根据添加的标签搜索和筛选资源。有关如何实施有效的资源标记策略的更多信息，请参阅 AWS 白皮书标记最佳实践。

您可以点击添加标签然后填写标签名和标签值。您可以将标签的值设为空的字符串，但是不能将其设为空值。如果您添加的标签的值与该实例上现有标签的值相同，新的值就会覆盖旧值。如果删除资源，资源的所有标签也会被删除。

信息填写完成后，请点击部署，来启动部署，并跳转至部署过程的进度页面

5.部署成功后点击页面上的 Kyligence Cloud 服务地址，即可进入 Kyligence Cloud 主页面。

Kyligence Cloud 将在您所选 AWS 区域内自动创建所需的资源和服务，整个过程大概需要 20 分钟左右，具体时间可能因不同云环境的网络条件有所偏差。

6.首次进入会提示您输入 Kyligence Cloud 许可证，请上传您的 License 文件

如果您是首次试用 Kyligence Cloud, 您可以在 Kyligence 官网申请试用 License，然后在试用欢迎邮件中下载您的试用 License 文件

7.输入默认用户名和密码，登录 Kyligence Cloud 。登录后建议您前往帮助菜单修改密码。

用户名: ADMIN
密码: KYLIN

创建工作区

部署了 Kyligence Cloud 之后，您需要创建一个工作区，用于连接数据源及加速查询。

您需要在创建工作区页面输入以下信息：

工作区名称：请输入工作区名称
数据源类型：
- 在 AWS Global 平台，您可以选择 Amazon S3 或者 Snowflake 作为数据源
- 在 AWS China 平台，您可以选择 Amazon S3 作为数据源
如果使用 Snowflake 作为数据源，您需要输入 Snowflake 的用户名、密码及 JDBC 连接串信息，例如:
```
  jdbc:snowflake://demo.snowflakecomputing.com/?db=demo&warehouse=demo
```
查询引擎 SSH 密钥：请创建用来访问您的 Kyligence Cloud 的查询引擎的 SSH 密钥
S3 存储桶：请选择您用于存放 Kyligence Cloud 数据的 S3 存储桶
集群配置：请输入您的总加载数据量，Kyligence Cloud 将为您推荐集群配置，您可以点击“启用自定义配置”来调整集群配置

填写完表单后点击右下角的审核+创建，Kyligence Cloud 将自动创建 Spark 集群，创建过程大约需要 5-10 分钟

创建项目

工作区创建完成后，您需要在工作区内创建项目。您可以在一个工作区内创建多个项目，共享集群资源并服务于不同的业务范围。

导入样例数据

本功能在 AWS 平台当前仅支持 Amazon S3 数据源，如果您使用 Snowflake 作为数据源，请参考 Snowflake 数据源文档添加数据源

Kyligence Cloud 内置了 NYC_Taxi 数据集，包含了绿色出租车2019年1月份的出行数据。进入 数据源 页面，点击 添加表，选择 导入样例表 ，即可一键导入样例表和模型。关于样例模型的说明及数据字典，请参考样例模型。

当页面中出现"导入成功"的提示后，请打开模型界面，您可以看到 nyc_taxi_green_trip 即为导入的样例模型。

如果您需要使用样例表进行建模，请参考模型章节来创建模型

为了加速查询，请您单击 nyc_taxi_green_trip 模型下方的 聚合索引 页面中的 构建索引 按钮，为模型加载数据，用于接下来的分析。

构建索引的过程大概需要 5-8 分钟，您可以在任务页面查询进度。

构建完成后即可使用该数据集进行分析，您可以打开查询页面输入 SQL 语句进行查询。

分析数据

Kyligence Cloud 内置一个可视化分析工具 Kyligence Insight，本节以 Kyligence Insight 为例介绍数据分析的过程，具体步骤如下:

安装并启动 Kyligence Insight

在 连接 BI 页面点击连接内置的 Kyligence Insight 下方的 安装并启动，等待安装后打开 Kyligence Insight。

创建数据集

新建数据集：经过数据的加载，现在您可以自由地分析您的数据。首先点击导航栏中的 分析-连接BI-连接内置的 Kyligence Insight ，点击登录后，选择 sample 项目，进入数据集页面。然后点击左上角的 +数据集 按钮，并选择数据集用途为 SQL数据集。
定义数据集：首先在 基本信息 中输入数据集名称为 “Nyc_Taxi”,点击下一步。在 定义关系 中将所需的模型拖拽到右侧，然后点击下一步
定义语义：在 定义语义 中，您可以进行如下定义:
- 点击维度名称右侧的编辑按钮，以更改维度名称，例如，将 GREEN_TRIP_DATA 表中的 PICKUP_DATETIME 重命名为“上车时间”