这应该很简单,但我仍然没有找到方法。我必须计算一个新列,它的值是列 col1 和 col2 的最大值。所以如果 col1 是 2 而 col2 是 4,那么 new_col 应该有 4。等等。它位于 Pyspark 数据框中。
我尝试了 df=df.withColumn("new_col",max("col1","col2"))
,但收到错误“_() 需要 1 个位置参数,但给出了 2 个”。那么正确的方法是什么呢?
提前致谢。
Pyspark 中最多两列
•
问答