将多个分类变量转换为 R 中的因子

debugcn 发表于 Dev

迪泽

问候语

目前正在创建一个神经网络，并且需要正确地构建数据。对于其中一个数据列，有需要转换为数字的字符串数据。唯一的问题是，每一行中的字符串数据是示例QWERTGCD, AWERTKRD, TWERTKRR'等。有超过 1000 行的行，每一行都具有相同或不同的字符串，如发布的示例中所示。我不知道如何将多个字符串转换为这种规模的分类数据。标签分区也是如此。

到目前为止，我有这个开始

dataset$Box = as.numeric(factor(dataset$Box, levels = c(), labels = c()))

不确定我是否想得太多了，但我无法弄清楚如何准确地输入级别和表格，而无需费力地浏览数据并输入自己。

这是正在使用的数据的示例。

B,11979,13236,1261,3,QWERTGCD,1 B,475514,476069,559,33,QWERTOOD,1 C,65534,65867,337,1,QWERAEER,1 C,73738,74657,923,2,AWERTWED,1

谢谢

再次

如果没有可重现的示例，就很难确切地知道您需要什么，但总的来说，R 擅长的一件事是一次对整个列运行操作。您只是将其中dataset命名的列Box从字符串转换为数字，并通过一个因子。factor()为您查找列中的所有唯一值。所以你不需要指定它们。

dataset$Box <- as.numeric(factor(dataset$Box))

将获取Box数据集中的列并将其从 class 转换character为 class numeric，Box按字母数字顺序对字符值进行编号（除非您另行指定）。它甚至可能已经是一个因素，具体取决于您的数据集是如何生成的。您可以使用class(dataset$Box). 如果它返回factor那么你只需要运行dataset$Box <- as.numeric(dataset$Box)

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-18

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

将多个分类变量转换为 R 中的因子

将多个分类变量转换为 R 中的因子

使用来自 R 中 .csv 的信息将多个变量转换为因子

如何将虚拟变量转换为R中的因子？

将因子转换为R中的多个列

R-将各种虚拟变量/逻辑变量从其名称转换为单个分类变量/因子

R：将多个特定变量转换为因子

R：将多个特定变量转换为因子

将因子转换为R中的数值

将因子转换为R中的数值

将R中的因子变量min：second转换为数值变量min.seconds

无法将列表转换为R中的因子

将因子转换为R中的日期和时间

将布尔框架转换为 R 中的因子

将因子向量转换为R中具有二元变量的列

如何在保留R中的数字的同时将因子变量转换为数字

将列中的每个因子转换为R中频率第二高的因子

虚拟变量到R中的单个分类变量（因子）

将包含多个变量的文本变量转换为R中的单独变量的最佳方法是什么？

在许多列中转换分类列作为 R 中的因子

如何将因子变量转换为数值-使用R

通过R中的多个条件将一个变量转换为两个变量

R中具有因子变量的线图

区分R中的因子变量的水平

忽略r中因子变量的频率情况

因子范围作为R中的函数变量

从R中的因子记录创建变量

在R中绘制双变量到多个因子

将数据框中的数字范围转换为R中的字符/因子？

在R编程中，将因子类型转换为矩阵中列的整数类型

将因子组合转换为R中存在/不存在的宽格式表