如何从String Spark Java列表数据集创建String数据集

我有一个字符串列表数据集,我需要从上面创建一个新的数据集,并将列表的每个条目作为新数据集中的一行。

List<String> list = new ArrayList("abc","def","ghi");

Dataset<String> input = spark.createDataset(list,Encoders.bean(String.class));

新数据集应为:

"abc
def
ghi"

预先感谢

orcking080 回答:如何从String Spark Java列表数据集创建String数据集

您可以使用flatmap将String列表转换为单个String。 // flatMap每行到行中的单词

JavaRDD<String> words = input.toJavaRDD().flatMap(s -> Arrays.asList(s.split(",")).iterator());
本文链接:https://www.f2er.com/3169087.html

大家都在问