我想使用pyarrow读取位于s3存储桶中的csv文件,并将其转换为镶木地板到另一个存储桶。 我在从s3读取csv文件时遇到问题。我尝试阅读下面的代码,但失败了.pyarrow支持从s3读取csv吗?
from pyarrow import csv
s3_input_csv_path='s3://bucket1/0001.csv'
table=csv.read_csv(s3_input_csv_path)
这引发错误 “ errorMessage”:“无法打开本地文件's3://bucket1/0001.csv',错误:没有这样的文件或目录”,
我知道我们可以使用boto3读取csv文件,然后可以使用pandas将其转换为数据帧,最后使用pyarrow转换为镶木地板。但是,在这种方法中,还需要将熊猫添加到包装中,以使与pyarrow一起使用时,包装大小不能超过lambda的250 mb限制。