我正在使用带有JSON文件的数据块中的pyspark清理数据。 eval
括号中的表达式来自JSON文件。
我面临的问题之一是操纵timestamp
s / string
。
我试图找出时间戳列和单个日期(是字符串)之间的月份差异
请参见下面的代码。
import pyspark.sql.functions as F
df2 = df2.withColumn('test',eval("months_between( F.to_date(F.col('period_name')),lit('31/03/2019'))"))
它不会引发错误,但求值为空。