spark-avro

反序列化Avro Spark

我正在使用以下代码利用<code>dummy <- data.frame(categorical_1 = c("a", "b", "a", "a", "

前端之家
2022-08-16 • 问答
读取AVRO数据时，火花作业会引发空指针异常

火花作业在读取数据时抛出空指针异常。我正在获取avro数据并将其加入另一个数据集，但出现此错误

前端之家
2022-08-15 • 问答
从Avro表中读取数据时发生sql sql错误

当我尝试使用spark-sql从avro表中读取数据时，出现此错误。 <pre><code>Caused by: java.lang.NullPointerException

前端之家
2022-08-15 • 问答
当新分区中的列多于旧分区时，如何从Avro中读取所有列？

我已经按日期和时间划分了Avro格式的数据，并且每小时都会收到新数据。新分区可以包含比旧分区更多

前端之家
2022-08-14 • 问答
Pyspark 2.4.3，从Kafka读取Avro格式消息-Pyspark结构化流

我正在尝试使用PySpark 2.4.3从Kafka读取Avro消息。基于下面的基于流的堆栈链接，能够转换为Avro格式（to_avr

前端之家
2022-08-13 • 问答
如何从databricks中的avro文件创建数据框？

我已经使用spark.avro并从我的数据块中读取了avro文件，但是我看到的记录不是我想要的。这是我正在看的

前端之家
2022-08-07 • 问答
提供程序org.apache.spark.sql.avro.AvroFileFormat无法实例化

无法从Spark Streaming应用程序向Kafka主题发送avro格式消息。在线提供的有关avro spark流示例代码的信息很少

前端之家
2022-08-04 • 问答
使用Spark或Hive控制台从Avro表中读取异常-无法从文件架构“字符串”获取varchar字段的maxLength值

我在Hive中创建了2个表 <pre><code>CREATE external TABLE avro1(id INT,name VARCHAR(64),dept VARCHAR(64)) PARTITIONED BY (yoj V

前端之家
2022-07-31 • 问答
java.lang.IllegalAccessError：尝试访问方法org.apache.avro.specific.SpecificData。（）V

AvroPlanCompleteTrigger是avro模式生成的pojo java类。当我们在本地运行时，代码可以工作。 Avro版本：1.

前端之家
2022-07-28 • 问答
将行rdd转换为通用记录rdd

我正在尝试将JavaRDD行转换为JavaRDD GenericRecord。我可以使用以下代码实现简单的模式。 <pre><code> Data

前端之家
2022-07-27 • 问答
如何在Java Spark中将avro文件作为对象列表读取

我有一个Avro文件，将其转换为代表对象后，我想对其进行读取和操作我尝试在Java Spark中使用RDD和

前端之家
2022-07-25 • 问答
使用Spark Write强制架构

我有一个avro格式的加密数据，它具有以下模式 <pre><code>{"type":"record","name":"Protec

前端之家
2022-07-25 • 问答
Spark Dataset mapGroups操作后，值类型为二进制，甚至在函数中返回String

环境： <pre><code>Spark version: 2.3.0 Run Mode: Local Java version: Java 8 </code></pre> spark应用程序尝试执行以

前端之家
2022-07-18 • 问答
无法访问Scala中反序列化的嵌套式Avro通用记录元素

我正在使用结构化流（Spark 2.4.0）通过kafka读取avro消息并使用融合架构注册中心以接收/读取架构

前端之家
2022-07-14 • 问答
org.apache.avro.AvroTypeException：预期的记录开始。得到了VALUE_STRING

我正在执行从json到Avro Record的简单转换，但是我遇到了这个问题，尝试了很多方法，我从stackoverflow和在

前端之家
2022-07-13 • 问答
尝试读取Avro文件并执行操作时，Spark应用程序中出现“ java.lang.OutOfMemoryError：Java堆空间”错误

平均大小约为44MB。下面是纱线记录错误： <pre><code>20/03/30 06:55:04 INFO spark.ExecutorAllocationManager:

前端之家
2022-07-13 • 问答
Spark Scala：需要从avro文件（数据帧）的路径中获取条件数据

我有一个Avro文件，其中有一个数组类型的字段。以下是该字段的架构： { “ name”：“

前端之家
2022-07-11 • 问答
Spark Avro文件编写

我是基于Java的Spark应用程序的初学者。当前遇到了Spark Java应用程序avro编写问题，希望获得您的输

前端之家
2022-07-11 • 问答
如何将spark.sql.Row转换为avro.generic.GenericRecord？

我有一个DataFrame，需要将其转换为Dataset [GenericRecord]。

前端之家
2022-07-08 • 问答
将DataFrame写入Avro文件

我在服务器上这样启动pyspark命令shell： <pre><code>pyspark --packages org.apache.spark:spark-avro_2.11:2.4.0 </code></pr

前端之家
2022-07-07 • 问答
将avro jars复制到docker jars目录中

我正在学习spark我想使用avro数据文件，因为avro在spark外部。我已经下载了罐子。但是我的问题是如何将

前端之家
2022-07-05 • 问答
使用Spark生成更少的架构

是否有一种方法可以从Apache Spark生成更少的avro模式？我可以看到一种使用apache avro库通过Java / Scala以及

前端之家
2022-07-04 • 问答
在Spark中将Bytearray转换为字符串

我试图将JSON转换为二进制AVRO，最终在每个记录的前面都得到了bytearray类型。在转换为string之前，如何

前端之家
2022-07-04 • 问答
Spark：从DataFrame读取AVRO元数据

我使用Kafka Connect HDFS Sink提取了HDFS中保存的AVRO文件。这是架构注册表项的一部分： <pre><code>{

前端之家
2022-07-03 • 问答
如何使用pyspark读取avro文件

我正在尝试在jupyter笔记本中读取avro文件，但面临此问题。 <pre><code>Caused by: java.lang.ClassNotFoundExceptio

前端之家
2022-07-03 • 问答
Spark不从二进制文件读取所有记录

我正在尝试从S3读取Avro文件，如本<a href="https://spark.apache.org/docs/2.1.1/api/java/org/apache/spark/SparkContext.html#bin

前端之家
2022-07-02 • 问答
以avro格式将dataframe写入kafka主题以获取Spark <2.4吗？

Q1。考虑到我有一个数据帧<code>df</code>和一个架构<code>myschema</code>，我该如何继续以avro格式将该数据帧

前端之家
2022-06-30 • 问答
Avro-为每个字段添加文档/说明

我们正在使用avro进行架构定义。是否可以为avro中的每个字段添加字段说明。我同意我们可以在记录级别

前端之家
2022-06-29 • 问答
找到了接口org.apache.hadoop.mapreduce.TaskAttemptContext，但是期望使用类

脚本的单元测试代码 <pre><code>"execute" should "Script should write data in expected path " in { impli

前端之家
2022-06-29 • 问答
Spark反序列化行为对于from_avro很奇怪

我有一个只有1个类型为map的字段的模式： <pre><code>val jsonSchema = s""" |{"type": &#

前端之家
2022-06-29 • 问答

首页

下一页
末页