我有一项服务运行的熊猫版本为0.25.2。该服务从数据库读取数据并将快照存储为csv
df = pd.read_sql_query(sql_cmd,oracle)
查询将导致数据帧中包含一些非常大的datetime值。 (例如3000-01-02 00:00:00)
之后,我使用df.to_csv(index=False)
创建一个csv快照并将其写入文件
在安装了熊猫0.25.3的另一台计算机上,我正在将csv文件的内容读取到数据框中,并尝试将date列的数据类型更改为datetime。这导致OutOfBoundsDatetime
异常
df = pd.read_csv("xy.csv")
pd.to_datetime(df['val_until'])
pandas._libs.tslibs.np_datetime.OutOfBoundsDatetime: Out of bounds nanosecond timestamp: 3000-01-02 00:00:00
我正在考虑使用pickle创建快照并直接加载数据帧。但是,我很好奇为什么熊猫能够在第一种情况下而不是第二种情况下处理较大的日期时间。 另外,我对如何继续使用csv作为传输格式的任何建议都表示赞赏