databricks

Databricks GCP BigQuery - 创建处置 (CREATE_IF_NEEDED)

使用 GCP 中的 Databricks，我想将一些数据写入 google bigQuery。 <pre><code>df.write .format("bigquery") .mo

前端之家
2022-04-15 • 问答
无法使用 SparkR 对数据进行子集化，使用管道约定执行命令

我正在处理一些如下所示的数据： <a href="https://i.stack.imgur.com/JybYZ.png" rel="nofollow noreferrer">dataFrame</a> <

前端之家
2022-04-15 • 问答
获取火花流数据集的头

一旦读入 Spark 流数据集，是否可以与它进行交互？例如，这会读取、转换和显示流数据： <pre><code>var

前端之家
2022-04-15 • 问答
数据块继承了 SparkR 和 tidyverse 签名错误的方法

我在 databricks 中使用 Sparkr 和 tidyverse 运行以下程序并收到以下错误。 h(simpleError(msg, call)) 中的错误

前端之家
2022-04-15 • 问答
使用笔记本（Databricks）显示错误 java.io.IOException：从元数据服务器获取访问令牌时出错

当我尝试通过 Python 命令访问 Storage GCP 时，我正在使用 <a href="https://community.cloud.databricks.com/" rel="nofollow

前端之家
2022-04-15 • 问答
使用 python 和 Azure AD 通过 odbc 连接到 Azure Databricks

能否请您给我一些说明或资源（因为我找不到任何可能为我指明正确方向的信息）以及如何使用 odbc（pyt

前端之家
2022-04-15 • 问答
限制 Databricks 工作区中非管理员用户的权限

我们目前的设置中，数据探索和生产作业（从生产工作流运行）位于单个数据工作区中。生产作业

前端之家
2022-04-15 • 问答
Databricks pyspark 中的“JavaPackage”对象不可调用”错误

在添加“JavaPackage 对象不可调用错误：Pyspark”中建议的代码后，即使在 Databricks pysparks 中出现错误“'Jav

前端之家
2022-04-15 • 问答
当目录按年/月/日格式化时，有没有办法使用 ReadStream 来优化读取？

我相信 Spark readstream for files 会列出目录来确定要读取的新文件。有没有办法为 readstream 提供提示，以便

前端之家
2022-04-15 • 问答
java.lang.NoClassDefFoundError：使用 deequ 库执行 pyspark 代码时出现 scala/Product$class 错误

我在带有 deequ 1.0.5 库的数据块中收到以下代码的“java.lang.NoClassDefFoundError: scala/Product$class”错误。任何

前端之家
2022-04-15 • 问答
如何使用 ADF 在数据块中安装 jar

我们能够使用 UI 方法将 jar 文件安装到特定集群。但是我们要求在工作区中的所有按需集群上安装它。

前端之家
2022-04-15 • 问答
Databricks 错误：org.postgresql.util.PSQLException：不支持身份验证类型 10

目前，我在 Databricks 上使用带有选项 jdbc 的 spark 运行代码以连接到 postgresql 以获取数据。 <strong>PostgreSQL

前端之家
2022-04-15 • 问答
使用数据块在原始文件中搜索值？

我在存储中有一个大的 GB+ 大小的文件（恰好是 json）。有没有一种方法可以告诉数据块在整个文件中运

前端之家
2022-04-15 • 问答
为什么使用 Spark Structured Streaming 删除或选择列不能正常工作？

我有以下代码和结果。在这里，我使用的是 Databricks 的自动加载器。 <a href="https://i.stack.imgur.com/QYxb

前端之家
2022-04-15 • 问答
在 Databricks 中执行“显示创建表”OpenCSV Serde Hive 表时出错

我在 DDL 下面的 Databricks 中使用 OpenCSV Serde 创建了一个表：- <pre><code> CREATE TABLE db_name.table_name( col1 S

前端之家
2022-04-15 • 问答
在 Azure Databricks 中使用 %sh 时，如何访问小部件中设置的值？

在 Azure Databricks 中，在 notebook 中使用 %sh 作为魔法命令时，如何访问小部件中设置的值？我在下面

前端之家
2022-04-15 • 问答
使用 PySpark 训练多个词嵌入模型陷入困境

很高兴终于发布了我的第一个问题，但如果我不清楚或违反了标准礼仪，请轻推我。我真诚地感谢我能

前端之家
2022-04-15 • 问答
安装 Data Bricks CLI 时遇到问题。无法在命令提示符下输入令牌值

我正在尝试安装数据砖 CLI。在命令提示符下，我输入了命令数据砖配置 --token 并提供了数据砖主机 URL。

前端之家
2022-04-15 • 问答
黄土火花/Pyspark

我想知道 LOESS（局部估计的散点图平滑）回归是否是 Spark/PySpark 内置的函数（我对 PySpark 的答案更感兴

前端之家
2022-04-15 • 问答
如何从 shell 访问 DBFS？

不知何故，在 Databricks 8 环境中，我似乎无法从 shell/bash 访问 Databricks 文件系统 (DBFS)。这是命令： <pr

前端之家
2022-04-15 • 问答
Spark - MongoDB（当我覆盖我的收藏时出现问题）

<h1>我创建此代码是为了覆盖 mongo DB 中的集合。但是当我覆盖我的集合时，我的索引被删除，有没有办法在

前端之家
2022-04-15 • 问答
有没有办法在 SPARK SQL 中将我们的视图调用到不同的笔记本？

我是数据块的新手，我主要在那里研究 SQL。我在一个笔记本中创建了一个临时视图，我必须在另一个笔

前端之家
2022-04-15 • 问答
使用 pyspark 从 db2 中提取 UTF-8 数据

我正在尝试使用 pyspark 从 db2 中提取 utf-8 数据。使用的代码： <pre><code>remote_table = spark.read.format

前端之家
2022-04-15 • 问答
使用 Ganglia Viz 对 PySpark 应用程序进行故障排除

我目前正在努力让 PySpark 脚本在 Databricks 集群上高效执行。以下可视化对应于我将数据帧写入镶木地板

前端之家
2022-04-15 • 问答
在 Databricks 上的 python 控制台中运行 __main__.py 文件？

我只是 pip 安装了一个包，但是，它的主要运行文件是一个 <code>__main__.py</code> 文件，这意味着它应该从

前端之家
2022-04-15 • 问答
以明文形式可见的 Databricks 秘密

我有一个要求，即在 databricks 中启动集群时需要一个密钥。我发现了以下为我的 init 脚本提供秘密的方

前端之家
2022-04-15 • 问答
如何在 pyspark 中转置数据帧？

如何从具有以下结构的数据框出发： <div class="s-table-container"> <table class="s-table"> <头> <tr> <th style="text-a

前端之家
2022-04-15 • 问答
在连接数据帧结果中显示用作关键连接的两列

我有以下简单的连接： <pre><code>df_join = (df1.join(df2, on=['key'], how='left').select(df1['key'],

前端之家
2022-04-15 • 问答
如何在 Databricks 上使用 Apache Spark/python 将字符串拆分为多列

尝试使用 python 在 Databricks 上将字符串列拆分为 4 列：A、B、C、D。 <pre><code># Load CSV file df = spark.read.fo

前端之家
2022-04-15 • 问答

首页
上一页

末页