读取CSV文件时，Redshift Spectrum是否可以处理双引号括起来的字段后的尾随空间？

2024-04-27 • 问答

我有一个csv文件，其中的字段用双引号引起来。我使用OpenCSVSerDe在其上创建了Redshift外部表。问题是我文件中的行之一在双引号外有一个尾随空格。像这样：

"name1","123","something"
"name2","234","somethingelse"

现在在外部表上执行SELECT，第一列的第一行返回NULL。

       123  something
name2  234  somethingelse

但是，S3 SELECT功能返回的正确值如下：

name1  123  something
name2  234  somethingelse

在表级别上是否有任何属性可以用来正确检索数据，或者这是一个限制？

表DDL：

CREATE EXTERNAL TABLE test_table
(
 column1 varchar(50),column2 varchar(50),column3 varchar(100)
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
WITH SERDEPROPERTIES ('separatorChar' = ',') --checked with and without this
STORED AS textfile
LOCATION 's3://s3bucketlocation'
;

icem_net 回答：读取CSV文件时，Redshift Spectrum是否可以处理双引号括起来的字段后的尾随空间？

暂时没有好的解决方案，如果你有好的解决方案，请发邮件至：iooj@foxmail.com

amazon-redshift amazon-redshift-spectrum csv external-tables

本文链接：https://www.f2er.com/2740422.html

读取CSV文件时，Redshift Spectrum是否可以处理双引号括起来的字段后的尾随空间？

icem_net 回答：读取CSV文件时，Redshift Spectrum是否可以处理双引号括起来的字段后的尾随空间？

大家都在问