You need to enable JavaScript to run this app.
导航

Databricks

最近更新时间2023.10.30 10:43:55

首次发布时间2023.01.30 22:54:37

1. 概述

智能数据洞察支持接入 Databricks 数据库获取数据,进而创建数据集,进一步进行分析。数据连接支持 直连或抽取 Databricks 数据源。

2. 前期准备

获取必要的连接信息,您需要执行以下操作来获取相关信息:
(1)登录到您的 Databricks 工作区并转到 Data Science & Engineering or Databricks Machine Learning 的环境。

要更改角色,请单击 Databricks 徽标下方的图标。

(2)单击边栏中的 Compute 选项卡。

(3)选择要连接的集群并点击进入。

(4)点击 Advanced Options

(5)单击 JDBC/ODBC 选项卡,复制 JDBC URL 在后续连接中使用。

(6)生成 token。
alt
如果您使用子账号的token进行连接,需要确保子账号有对应库表的USAGE,READ_METADATA权限;如下图所示:
alt

3. 快速入门

下面介绍两种方式创建数据连接。

3.1 从"数据连接"新建

(1)进入火山引擎,点击进入到某个具体项目下,点击数据准备,在下拉列表找到数据连接,点击数据连接。
(2)在页面中选择 Databricks 文件。
alt
(3)填写所需的基本信息,并进行测试连接,连接成功后点击保存。

  • JDBC 连接串:填写“前期准备”中所复制的 JDBC 字符串;
  • 用户名/密码:填写“前期准备”的第6步中生成的 token;

    (4)确认数据连接的基本信息无误后即完成数据连接。
    alt
    alt
    (5)可使用该连接作为数据源去创建数据集:点击数据准备-->数据集,选择左上角「新建」按钮进行数据集的新建。

(6)搜索或下拉已有连接,选择之前新建好的数据源。
alt

3.2 从数据集新建

(1)进入火山引擎,点击数据准备-->数据集,选择左上角「新建」按钮,新建数据集。


(2)选择数据连接的时候,点击新建配置。
alt
之后的步骤与上述 3.1 的(2)、(3)步一致,在完成上传之后会停在数据集选择数据连接的弹出框中,即可直接进行下一步的数据集创建。
alt

4. 常见问题

如果测试连接报 403 错误,请首先查看用户名和密码是否填写正确,若无误,尝试 Databricks 侧添加白名单解决。