如何在pyspark中填写缺少的数据框日期

我在python中有一些代码想要转换为Pyspark。我注意到pyspark不支持set_index。

要使其在Pyspark中运行,我需要进行哪些更改?

    df4 = df3.set_index(['sales_date','brand_id','customer_id']).\
  unstack([1,2]).\
  resample('D').asfreq().\
  fillna(0).\
  stack([1,2]).\
  reset_index()

谢谢

soyi8 回答:如何在pyspark中填写缺少的数据框日期

暂时没有好的解决方案,如果你有好的解决方案,请发邮件至:iooj@foxmail.com
本文链接:https://www.f2er.com/3000937.html

大家都在问