使用LIME进行模型解释时处理类别,浮点和整数类型特征

ML_Enthu

我正在使用具有混合特征类型的Lime(本地可解释模型不可知的解释)来评估分类任务的模型预测。有谁知道如何在lime.lime_tabular.LimeTabularExplainer()方法中指定二进制功能。LIME如何实际处理这些类型的功能(只有1和0的更多功能)?

fpajot

我认为您应该将您的二进制特征声明为分类特征,以使您的Lime解释器在研究样本周围进行局部扰动时可以有效地使用其采样机制。

您可以使用LimeTabularExplainer构造函数中的categorical_features关键字参数来完成此操作

my_binary_feature_column_index = 0 # put your column index here    

explainer = LimeTabularExplainer(my_data, categorical_features=[my_binary_feature_column_index], categorical_name={my_binary_feature_column_index: ["foo", "bar", "baz"]})
  • categorical_features是分类列索引的列表,并且
  • categorical_name是一个字典,其中包含列索引和类别名称列表的映射。

正如在LIME代码中提到的:

解释关于表格(即矩阵)数据的预测。对于数字特征,根据训练数据中的均值和标准差,通过从正态(0,1)进行采样并对均值居中和缩放进行逆运算来扰动它们。对于分类特征,通过根据训练分布进行采样来扰动,并在值与所说明的实例相同时将二进制特征设为1。

因此,分类特征是在底层进行热编码的,并且根据训练数据集中的特征分布使用值0或1(除非您选择使用LabelEncoder,否则将导致LIME将特征作为连续变量进行处理) 。

LIME项目中提供了一个很好的教程:https : //github.com/marcotcr/lime/blob/master/doc/notebooks/Tutorial%20-%20continuous%20and%20categorical%20features.ipynb

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

尝试使用 MMLSpark 的 scala LIME 库解释模型时出现异常

来自分类Dev

PostgreSQL:在将整数强制转换为非整数类型以强制在PostgreSQL中进行浮点除法时,应使用哪种数字类型?

来自分类Dev

使用整数vs浮点数时,Ruby如何解释指数?

来自分类Dev

如何预处理新实例进行分类,以使特征编码与使用Scikit-learn的模型相同?

来自分类Dev

对浮点类型进行编译时操作

来自分类Dev

使用C进行类型转换-整数和字符*

来自分类Dev

使用泛型类型动态计算浮点数和整数

来自分类Dev

如何使用bash或其他语言/框架进行整数和浮点计算?

来自分类Dev

使用 tkinter 对整数和浮点值进行条目小部件验证

来自分类Dev

使用类型特征时如何排列文件?

来自分类Dev

整数和浮点文字是否指向并使用?

来自分类Dev

Rust中具有整数和浮点数的泛型函数出现问题。通过Rust进行计算机程序的结构和解释

来自分类Dev

如何分别专门针对整数和浮点类型的模板函数?

来自分类Dev

在实数浮点数和整数之间进行转换

来自分类Dev

在实数浮点数和整数之间进行转换

来自分类Dev

C和C ++中的整数类型,并由printf解释

来自分类Dev

在python中使用sql时如何使用参数,包括整数,浮点数和字符串?

来自分类Dev

如何打印一些特征及其特征类型(类别)?

来自分类Dev

GLhalf 是浮点类型还是整数?

来自分类Dev

当我使用管道预处理,训练和测试线性svc时,如何获得最重要的特征系数?

来自分类Dev

将浮点数添加到整数时出现整数类型错误

来自分类Dev

使用自定义特征和bool类型的c ++ 11枚举时clang的编译错误

来自分类Dev

如何使用Django Querysets和Q()与相同模型类型的对象进行比较?

来自分类Dev

如何使用Django Querysets和Q()与相同模型类型的对象进行比较?

来自分类Dev

使用特征作为类型参数时借阅检查器失败

来自分类Dev

简单的Add函数可使用整数和浮点数

来自分类Dev

使用spafe库进行特征提取时导入错误

来自分类Dev

了解Scala中的案例类别和特征

来自分类Dev

处理长整数类型时,SQL SDK和存储过程之间的不一致

Related 相关文章

  1. 1

    尝试使用 MMLSpark 的 scala LIME 库解释模型时出现异常

  2. 2

    PostgreSQL:在将整数强制转换为非整数类型以强制在PostgreSQL中进行浮点除法时,应使用哪种数字类型?

  3. 3

    使用整数vs浮点数时,Ruby如何解释指数?

  4. 4

    如何预处理新实例进行分类,以使特征编码与使用Scikit-learn的模型相同?

  5. 5

    对浮点类型进行编译时操作

  6. 6

    使用C进行类型转换-整数和字符*

  7. 7

    使用泛型类型动态计算浮点数和整数

  8. 8

    如何使用bash或其他语言/框架进行整数和浮点计算?

  9. 9

    使用 tkinter 对整数和浮点值进行条目小部件验证

  10. 10

    使用类型特征时如何排列文件?

  11. 11

    整数和浮点文字是否指向并使用?

  12. 12

    Rust中具有整数和浮点数的泛型函数出现问题。通过Rust进行计算机程序的结构和解释

  13. 13

    如何分别专门针对整数和浮点类型的模板函数?

  14. 14

    在实数浮点数和整数之间进行转换

  15. 15

    在实数浮点数和整数之间进行转换

  16. 16

    C和C ++中的整数类型,并由printf解释

  17. 17

    在python中使用sql时如何使用参数,包括整数,浮点数和字符串?

  18. 18

    如何打印一些特征及其特征类型(类别)?

  19. 19

    GLhalf 是浮点类型还是整数?

  20. 20

    当我使用管道预处理,训练和测试线性svc时,如何获得最重要的特征系数?

  21. 21

    将浮点数添加到整数时出现整数类型错误

  22. 22

    使用自定义特征和bool类型的c ++ 11枚举时clang的编译错误

  23. 23

    如何使用Django Querysets和Q()与相同模型类型的对象进行比较?

  24. 24

    如何使用Django Querysets和Q()与相同模型类型的对象进行比较?

  25. 25

    使用特征作为类型参数时借阅检查器失败

  26. 26

    简单的Add函数可使用整数和浮点数

  27. 27

    使用spafe库进行特征提取时导入错误

  28. 28

    了解Scala中的案例类别和特征

  29. 29

    处理长整数类型时,SQL SDK和存储过程之间的不一致

热门标签

归档