Pyspark 中最多两列

这应该很简单,但我仍然没有找到方法。我必须计算一个新列,它的值是列 col1 和 col2 的最大值。所以如果 col1 是 2 而 col2 是 4,那么 new_col 应该有 4。等等。它位于 Pyspark 数据框中。 我尝试了 df=df.withColumn("new_col",max("col1","col2")),但收到错误“_() 需要 1 个位置参数,但给出了 2 个”。那么正确的方法是什么呢? 提前致谢。

zhaofc 回答:Pyspark 中最多两列

你可以试试greatest

embed_content_in_dict = message.embeds[0].to_dict()
本文链接:https://www.f2er.com/4414.html

大家都在问