SAS7BDAT导入Python后如何修复捷克语言字符

2024-05-06 • 问答

我需要将sas7bdat文件导入Python。数据的一列是包含捷克语单词的字符串。如果我尝试导入它，捷克语字母会丢失。

我已经尝试使用熊猫pd.read_sas。但是，我在不同的列中有大日期，并且pd.read_sas得到here描述的错误（但是，SAS7bdaT对于大日期是可以的）。下面我复制了一个简化数据的示例（仅一行一列的数据集） This is a picture of test dataset ddd24 in SAS

import pandas as pd
from sas7bdat import SAS7bdaT
df7=SAS7bdaT('..\Kreditky\ddd24.sas7bdat').to_data_frame()
print(df7)

Expected=      Střední odborné
actual result= Stedn odborn

dong70378 回答：SAS7BDAT导入Python后如何修复捷克语言字符

尝试按以下方式添加encoding='utf-8'

df7=SAS7BDAT('..\Kreditky\ddd24.sas7bdat',encoding='utf-8').to_data_frame()

如果这也不起作用，请尝试查找输入的确切编码。例如。 encoding='iso-8859-1'。

encoding pandas sas

本文链接：https://www.f2er.com/3168337.html

SAS7BDAT导入Python后如何修复捷克语言字符

dong70378 回答：SAS7BDAT导入Python后如何修复捷克语言字符

大家都在问