如何在R中为大型数据集添加虚拟变量

谢尔顿

我有一个包含列名的大数据集:ID和Property。可能有几行共享同一个ID,这意味着一个ID具有许多不同的属性(分类变量)。我想为属性添加虚拟变量,最后在每行中获取一个具有不同ID的数据框,并使用1/0指示它是否具有该属性。原始数据具有200万行和10000个不同的属性。因此,理想情况下,我将通过组合相同的ID来缩小行的大小,并添加虚拟变量列(每个属性1列)。

当我使用以下代码时,R崩溃:

for(t in unique(df$property)){
df3[paste("property",t,sep="")] <- ifelse(df$property==t,1,0)

}

因此,我想知道为R中的大型数据集添加虚拟变量列的最有效方法是什么?

阿克伦

我们可以使用 table

as.data.frame.matrix(table(df1))
#  A B C D
#1 1 1 0 0
#3 0 0 1 0
#4 0 0 0 1
#5 0 0 0 2

否则有效的方法将dcast来自data.table

library(data.table)
dcast(setDT(df1), a~b, value.var = "a", length)

数据

df1 <- structure(list(a = c(1L, 1L, 3L, 4L, 5L, 5L), b = c("A", "B", 
"C", "D", "D", "D")), .Names = c("a", "b"), row.names = c("1", 
"2", "3", "4", "5", "6"), class = "data.frame")

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何在 R 中为大型数据集创建聚类图

来自分类Dev

如何在R中读取大型数据集的子集?

来自分类Dev

如何在MATLAB中为大型数据集选择2行并跳过3行?

来自分类Dev

如何在两个VirtualBox虚拟机之间复制大型数据集?

来自分类Dev

如何在MATLAB中创建和保存大型数据集?

来自分类Dev

在R中添加行时如何在for循环中对数据集的所有变量应用回归

来自分类Dev

如何在Rstudio中删除大型数据集中的变量?

来自分类Dev

如何在python中为大型数据创建哈希表?

来自分类Dev

如何在 IE10 中为数据集变量赋值?

来自分类Dev

重塑R中的大型数据集

来自分类Dev

如何在R中订购数据集

来自分类Dev

如何在R中查找数据集

来自分类Dev

如何在R中查找数据集

来自分类Dev

如何在熊猫数据框中将类型为Categorica的所有列编码为虚拟变量

来自分类Dev

如何在数据集列表中找到公用变量并在R中重塑它们?

来自分类Dev

向R中的glm添加虚拟变量

来自分类Dev

如何在R中的点图中添加第二个数据集?

来自分类Dev

在Python中为大型数据集创建邻接矩阵

来自分类Dev

如何从SQLite数据库读取所有表并将其存储为R中的数据集/变量?

来自分类Dev

如何在反应性中引用数据集变量

来自分类Dev

如何在数据表中为r中的每一行添加循环?

来自分类Dev

如何在熊猫数据框中将Categorica类型的所有列编码为虚拟变量

来自分类Dev

如何在不同的数据集(SSRS)中添加两列

来自分类Dev

如何对大型数据集的R中的for循环进行矢量化

来自分类Dev

如何在R中添加2D矩阵作为数据帧变量?

来自分类Dev

如何在R中添加2D矩阵作为数据帧变量?

来自分类Dev

如何在Directive Link函数中为变量添加TemplateURL?

来自分类Dev

如何在Linux中为日期变量添加时间?

来自分类Dev

如何在 PHP 中为变量添加单引号

Related 相关文章

  1. 1

    如何在 R 中为大型数据集创建聚类图

  2. 2

    如何在R中读取大型数据集的子集?

  3. 3

    如何在MATLAB中为大型数据集选择2行并跳过3行?

  4. 4

    如何在两个VirtualBox虚拟机之间复制大型数据集?

  5. 5

    如何在MATLAB中创建和保存大型数据集?

  6. 6

    在R中添加行时如何在for循环中对数据集的所有变量应用回归

  7. 7

    如何在Rstudio中删除大型数据集中的变量?

  8. 8

    如何在python中为大型数据创建哈希表?

  9. 9

    如何在 IE10 中为数据集变量赋值?

  10. 10

    重塑R中的大型数据集

  11. 11

    如何在R中订购数据集

  12. 12

    如何在R中查找数据集

  13. 13

    如何在R中查找数据集

  14. 14

    如何在熊猫数据框中将类型为Categorica的所有列编码为虚拟变量

  15. 15

    如何在数据集列表中找到公用变量并在R中重塑它们?

  16. 16

    向R中的glm添加虚拟变量

  17. 17

    如何在R中的点图中添加第二个数据集?

  18. 18

    在Python中为大型数据集创建邻接矩阵

  19. 19

    如何从SQLite数据库读取所有表并将其存储为R中的数据集/变量?

  20. 20

    如何在反应性中引用数据集变量

  21. 21

    如何在数据表中为r中的每一行添加循环?

  22. 22

    如何在熊猫数据框中将Categorica类型的所有列编码为虚拟变量

  23. 23

    如何在不同的数据集(SSRS)中添加两列

  24. 24

    如何对大型数据集的R中的for循环进行矢量化

  25. 25

    如何在R中添加2D矩阵作为数据帧变量?

  26. 26

    如何在R中添加2D矩阵作为数据帧变量?

  27. 27

    如何在Directive Link函数中为变量添加TemplateURL?

  28. 28

    如何在Linux中为日期变量添加时间?

  29. 29

    如何在 PHP 中为变量添加单引号

热门标签

归档