-
将 Glue 从 VPC 连接到 RDS、S3 和 Secrets manager
我需要我的 Glue 作业来访问 VPC 可访问的 RDS、s3 存储桶和 Secrets Manager。 我已经创建了一个 JDBC 连 -
如何在胶水中将数组表连接成一个根表
我在 dfc.key() 中加入多个表生成时遇到问题 试图将其加入到根表中,但无法做到。 Relationalize -
使用 AWS Glue 中的动态框架更新 RDS 表
我有一个粘合工作,因为我将数据从 csv 插入到 postgresql 表。现在我需要更新 postgresql 数据库表中的一行 -
调用 o79.getDynamicFrame 时出错。 [Amazon](500310) 无效操作:“s_next_of_kin”处或附近的语法错误
我在 redshift 中有一个表,其中有一个列名 -->( agent's_next_of_kin) 如果你看到它的名字中有一个撇号 现在, -
Confluent 模式注册表与 Glue 模式注册表
我正在探索模式注册表,我有一个 Kafka 设置,现在我想为生产者和消费者引入模式支持。我发现两者都 -
从 pyspark 中的另一个数据库加载表
嗨,我敬爱的伙伴们! 我目前正在使用 AWS 和 PySpark。我的表存储在 S3 中,可从 Athena 查询。 -
基于作业参数的 AWS Data Glue ETL 过滤器提取输入
AWS Glue ETL 处理的新手,并尝试实施一项作业以从特定客户的 RDS MySQL 数据库中提取数据,执行一些转换 -
AWS Glue Studio: - 作业运行但将空文件输出到 S3
我正在使用 AWS Glue Studio 从 Parquet 格式的 S3 存储桶获取数据,连接数据并将其以 JSON 格式输出到另一个 S -
执行某些步骤后,Aws 日志未写入 Cloud Watch
我有一个 aws 作业,它读取 pyspark 中的 csv 文件,该文件将日志写入 aws cloud watch 。日志在初始步骤中写 -
使用 AWS Python SDK boto3 从表中列出由 AWS Glue 解析的所有 S3 文件
我试图通过 <a href="https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/glue.html#Glue.Client.get_table" rel= -
AWS Glue 动态帧将 csv 写入 s3 并使用 null
我有一个粘合工作,正在将动态帧写入 s3 中的 CSV,但由于某种原因,正在删除空值。什么是解决此问题 -
从见解查询中解析数字并绘制这些数字?
因此,在我的日志中,我开始跟踪函数完成其任务所需的时间。 假设这是我的一个日志示例: < -
PySpark 作业在调用 o803.showString 时中止
我正在使用 aws 胶运行 pyspark 脚本,我的程序在调用 .show() 函数时出错。该程序在过去 3 个月内一直顺利 -
AWS Glue:从 GET 请求传递 ID 值{1,2,3} 并将其传递给第二个 GET 请求,并将 ID 值附加到响应并转换为数据帧
<pre><code>First Json Response: "data": [ { "id": 123, "first_name": "abc" -
在数组火花数据帧 2.4 的嵌套结构中提取多个元素
我正在读取镶木地板文件并尝试从数组结构的结构中提取元素。但是,当我使用 getItem() 时,空值返回空