我需要将sas7bdat文件导入Python。数据的一列是包含捷克语单词的字符串。如果我尝试导入它,捷克语字母会丢失。
我已经尝试使用pd.read_sas熊猫。但是,我在不同的列中有大日期,并且pd.read_sas得到此处描述的错误(但是,SAS7BDAT对于大日期是可以的)。下面我复制了一个简化数据的示例(仅一行一列的数据集)。这是SAS中测试数据集ddd24的图片
import pandas as pd
from sas7bdat import SAS7BDAT
df7=SAS7BDAT('..\Kreditky\ddd24.sas7bdat').to_data_frame()
print(df7)
Expected= Střední odborné
Actual result= Stedn odborn
尝试添加encoding='utf-8'
为
df7=SAS7BDAT('..\Kreditky\ddd24.sas7bdat', encoding='utf-8').to_data_frame()
如果这也不起作用,请尝试查找输入的确切编码。例如encoding='iso-8859-1'
。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句