我有一个字符串列表数据集,我需要从上面创建一个新的数据集,并将列表的每个条目作为新数据集中的一行。
List<String> list = new ArrayList("abc","def","ghi");
Dataset<String> input = spark.createDataset(list,Encoders.bean(String.class));
新数据集应为:
"abc
def
ghi"
预先感谢
我有一个字符串列表数据集,我需要从上面创建一个新的数据集,并将列表的每个条目作为新数据集中的一行。
List<String> list = new ArrayList("abc","def","ghi");
Dataset<String> input = spark.createDataset(list,Encoders.bean(String.class));
新数据集应为:
"abc
def
ghi"
预先感谢
您可以使用flatmap将String列表转换为单个String。 // flatMap每行到行中的单词
JavaRDD<String> words = input.toJavaRDD().flatMap(s -> Arrays.asList(s.split(",")).iterator());