我使用scrapy和python从网页上收集游览日期。
年份不在字段中,例如“ 11月11日”或“ 1月21日”很好,因为我可以使用以下代码添加一年来进行字符串到日期的转换:
def sortdate(self,mydate):
newdate = datetime.strptime(
re.sub(r"\b([0123]?[0-9])(st|th|nd|rd)\b",r"\1",mydate) + " " + str(datetime.now().year),"%d %B %Y")
return newdate
这会将“ 11月11日”转换为“ datetime.datetime(2019,11,11,0,0)” 完美。
我现在的问题是,即使是明年的日期,它也会为所有内容添加2019。因此,我需要评估今天的日期(今天是2019年11月13日),然后在进行对话时将添加正确的年份。例如“ 1月11日”将是2020年,但“ 11月12日”现在也将是2020年(因为今天的日期已超过阈值)。