我正在尝试使用熊猫在Excel中找到相似的工作表名称。
目前,我正在使用下面的代码来获取熊猫表格的数据框。
excel= pd.ExcelFile(excel)
tab_name = 'Employee'
emp_df= excel.parse(tab_name)
但是,如果excel中的工作表名称包含任何空格或其他一些额外的字符,则此代码将失败。
有没有简单的方法可以做到这一点?
我使用相似性API(fuzzywuzzy)仅在运行时抛出未找到工作表的错误时找到相似的工作表 excel.parse(tab_name)
from fuzzywuzzy import fuzz
import xlrd
try:
tab_df = excel.parse(tab_name)
except xlrd.biffh.XLRDError:
sheet_names=excel.sheet_names
ratios = [fuzz.ratio(tab_name, tbname) for tbname in sheet_names]
if(max(ratios)>50):
tab_name = sheet_names[ratios.index(max(ratios))]
tab_df = excel.parse(tab_name)
else:
logger.error(tab_name+"Not found")
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句