SAS7BDAT导入Python后如何修复捷克语言字符

我需要将sas7bdat文件导入Python。数据的一列是包含捷克语单词的字符串。如果我尝试导入它,捷克语字母会丢失。

我已经尝试使用熊猫pd.read_sas。但是,我在不同的列中有大日期,并且pd.read_sas得到here描述的错误(但是,SAS7bdaT对于大日期是可以的)。下面我复制了一个简化数据的示例(仅一行一列的数据集) This is a picture of test dataset ddd24 in SAS

import pandas as pd
from sas7bdat import SAS7bdaT
df7=SAS7bdaT('..\Kreditky\ddd24.sas7bdat').to_data_frame()
print(df7)

Expected=      Střední odborné
actual result= Stedn odborn
dong70378 回答:SAS7BDAT导入Python后如何修复捷克语言字符

尝试按以下方式添加encoding='utf-8'

df7=SAS7BDAT('..\Kreditky\ddd24.sas7bdat',encoding='utf-8').to_data_frame()

如果这也不起作用,请尝试查找输入的确切编码。例如。 encoding='iso-8859-1'

本文链接:https://www.f2er.com/3168337.html

大家都在问