使用LIME进行模型解释时处理类别，浮点和整数类型特征

debugcn 发表于 Dev

ML_Enthu

我正在使用具有混合特征类型的Lime（本地可解释模型不可知的解释）来评估分类任务的模型预测。有谁知道如何在lime.lime_tabular.LimeTabularExplainer（）方法中指定二进制功能。LIME如何实际处理这些类型的功能（只有1和0的更多功能）？

fpajot

我认为您应该将您的二进制特征声明为分类特征，以使您的Lime解释器在研究样本周围进行局部扰动时可以有效地使用其采样机制。

您可以使用LimeTabularExplainer构造函数中的categorical_features关键字参数来完成此操作。

my_binary_feature_column_index = 0 # put your column index here    

explainer = LimeTabularExplainer(my_data, categorical_features=[my_binary_feature_column_index], categorical_name={my_binary_feature_column_index: ["foo", "bar", "baz"]})

categorical_features是分类列索引的列表，并且
categorical_name是一个字典，其中包含列索引和类别名称列表的映射。

正如在LIME代码中提到的：

解释关于表格（即矩阵）数据的预测。对于数字特征，根据训练数据中的均值和标准差，通过从正态（0,1）进行采样并对均值居中和缩放进行逆运算来扰动它们。对于分类特征，通过根据训练分布进行采样来扰动，并在值与所说明的实例相同时将二进制特征设为1。

因此，分类特征是在底层进行热编码的，并且根据训练数据集中的特征分布使用值0或1（除非您选择使用LabelEncoder，否则将导致LIME将特征作为连续变量进行处理）。

LIME项目中提供了一个很好的教程：https : //github.com/marcotcr/lime/blob/master/doc/notebooks/Tutorial%20-%20continuous%20and%20categorical%20features.ipynb

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-5

我来说两句

0条评论

登录后参与评论

来自分类Dev

尝试使用 MMLSpark 的 scala LIME 库解释模型时出现异常

来自分类Dev

PostgreSQL：在将整数强制转换为非整数类型以强制在PostgreSQL中进行浮点除法时，应使用哪种数字类型？

来自分类Dev

使用整数vs浮点数时，Ruby如何解释指数？

来自分类Dev

如何预处理新实例进行分类，以使特征编码与使用Scikit-learn的模型相同？

来自分类Dev

对浮点类型进行编译时操作

来自分类Dev

使用C进行类型转换-整数和字符*

来自分类Dev

使用泛型类型动态计算浮点数和整数

来自分类Dev

如何使用bash或其他语言/框架进行整数和浮点计算？

来自分类Dev

使用 tkinter 对整数和浮点值进行条目小部件验证

来自分类Dev

使用类型特征时如何排列文件？

来自分类Dev

整数和浮点文字是否指向并使用？

来自分类Dev

Rust中具有整数和浮点数的泛型函数出现问题。通过Rust进行计算机程序的结构和解释

来自分类Dev

如何分别专门针对整数和浮点类型的模板函数？

来自分类Dev

在实数浮点数和整数之间进行转换

来自分类Dev

在实数浮点数和整数之间进行转换

来自分类Dev

C和C ++中的整数类型，并由printf解释

来自分类Dev

在python中使用sql时如何使用参数，包括整数，浮点数和字符串？

来自分类Dev

如何打印一些特征及其特征类型（类别）？

来自分类Dev

GLhalf 是浮点类型还是整数？

来自分类Dev

当我使用管道预处理，训练和测试线性svc时，如何获得最重要的特征系数？

来自分类Dev

将浮点数添加到整数时出现整数类型错误

来自分类Dev

使用自定义特征和bool类型的c ++ 11枚举时clang的编译错误

来自分类Dev

如何使用Django Querysets和Q（）与相同模型类型的对象进行比较？

来自分类Dev

如何使用Django Querysets和Q（）与相同模型类型的对象进行比较？

来自分类Dev

使用特征作为类型参数时借阅检查器失败

来自分类Dev

简单的Add函数可使用整数和浮点数

来自分类Dev

使用spafe库进行特征提取时导入错误

来自分类Dev

了解Scala中的案例类别和特征

来自分类Dev

处理长整数类型时，SQL SDK和存储过程之间的不一致

Related 相关文章

文章