根据data.table中的另一列创建一列唯一标识符

MRP

如标题所示,我正在尝试在中创建一列,data.table将用作另一列的唯一标识符。我的数据集是几亿个观测值,但是这是我迄今为止编写的一组游戏和代码:

# I use a key because there are many more columns, but they are irrelevant here
myDT <- data.table(Addy=c("12hig", "12hig", "12hig", "1AbHN", "198aM"),key="Addy")

    Addy
1: 12hig
2: 12hig
3: 12hig
4: 198aM
5: 1AbHN

uniqueDT <- unique(myDT[,list(Addy)]) # is this inefficient?
uniqueDT[,mrpId := seq(1,nrow(uniqueDT),1)]

Addy mrpId
1: 12hig     1
2: 198aM     2
3: 1AbHN     3


myDT[J(uniqueDT)]
    Addy mrpId
1: 12hig     1
2: 12hig     1
3: 12hig     1
4: 198aM     2
5: 1AbHN     3

我上面的代码可以完成工作,但是我真的不知道它是否有效。有没有更data.table特别的方式呢?

编辑:

您可能想知道为什么我要根据唯一标识符创建唯一标识符。好吧,这里的想法是基本上创建一个哈希。“ Addy”列数据是很长的字符串,因此我需要对此数据进行操作,因此我认为最好使用较少的字节数。

乔什·奥布莱恩

这应该很快,并且至少要简单一些:

myDT[, mrpID:=.GRP, by=Addy]
myDT
    Addy mrpID
1: 12hig     1
2: 12hig     1
3: 12hig     1
4: 198aM     2
5: 1AbHN     3

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何根据另一列中的唯一标识符识别特定列中的更改?

来自分类Dev

根据 SQL 中的唯一列标识符将行数据转置为一列

来自分类Dev

根据可变条件和唯一标识符将一列中的堆叠数据转置为行

来自分类Dev

根据另一列中的重复值过滤一列中的唯一值

来自分类Dev

根据另一列中的唯一值查找一列中的重复项

来自分类Dev

根据另一列的计算创建一列

来自分类Dev

根据另一列中的值创建新列

来自分类Dev

根据另一列中的日期在一个列中创建唯一项向量

来自分类Dev

在熊猫中,如何从一列中的唯一值中创建列,然后根据另一列中的值填充它?

来自分类Dev

根据另一列求和唯一值

来自分类Dev

根据R中的唯一列值创建data.frame?

来自分类Dev

根据熊猫中其他列的值添加具有唯一标识符的列

来自分类Dev

根据数据框中另一列的值汇总和计算一列的唯一值

来自分类Dev

根据数据框中另一列的唯一值查找一列的所有组合

来自分类Dev

根据R中另一列中的唯一值创建批次的升序值,并批量添加新数据

来自分类Dev

从data.table中删除一列相同但另一列不同的行

来自分类Dev

R Data.table根据另一列划分列中的值

来自分类Dev

在R data.table中,根据另一列的值乘以列名

来自分类Dev

在R data.table中,根据另一列的值乘以列名

来自分类Dev

mysql-根据不同表中另一列的最大值选择唯一列

来自分类Dev

根据另一列+间隔更新一列

来自分类Dev

根据另一列更改一列的值

来自分类Dev

根据另一列+间隔更新一列

来自分类Dev

根据另一列填充 vsfgird 的一列

来自分类Dev

根据另一列的值更新一列

来自分类Dev

根据另一列减去一列

来自分类Dev

根据另一列的值添加一列

来自分类Dev

根据熊猫中的另一列对唯一值进行排序

来自分类Dev

根据另一列提取R数据表中的唯一行

Related 相关文章

  1. 1

    如何根据另一列中的唯一标识符识别特定列中的更改?

  2. 2

    根据 SQL 中的唯一列标识符将行数据转置为一列

  3. 3

    根据可变条件和唯一标识符将一列中的堆叠数据转置为行

  4. 4

    根据另一列中的重复值过滤一列中的唯一值

  5. 5

    根据另一列中的唯一值查找一列中的重复项

  6. 6

    根据另一列的计算创建一列

  7. 7

    根据另一列中的值创建新列

  8. 8

    根据另一列中的日期在一个列中创建唯一项向量

  9. 9

    在熊猫中,如何从一列中的唯一值中创建列,然后根据另一列中的值填充它?

  10. 10

    根据另一列求和唯一值

  11. 11

    根据R中的唯一列值创建data.frame?

  12. 12

    根据熊猫中其他列的值添加具有唯一标识符的列

  13. 13

    根据数据框中另一列的值汇总和计算一列的唯一值

  14. 14

    根据数据框中另一列的唯一值查找一列的所有组合

  15. 15

    根据R中另一列中的唯一值创建批次的升序值,并批量添加新数据

  16. 16

    从data.table中删除一列相同但另一列不同的行

  17. 17

    R Data.table根据另一列划分列中的值

  18. 18

    在R data.table中,根据另一列的值乘以列名

  19. 19

    在R data.table中,根据另一列的值乘以列名

  20. 20

    mysql-根据不同表中另一列的最大值选择唯一列

  21. 21

    根据另一列+间隔更新一列

  22. 22

    根据另一列更改一列的值

  23. 23

    根据另一列+间隔更新一列

  24. 24

    根据另一列填充 vsfgird 的一列

  25. 25

    根据另一列的值更新一列

  26. 26

    根据另一列减去一列

  27. 27

    根据另一列的值添加一列

  28. 28

    根据熊猫中的另一列对唯一值进行排序

  29. 29

    根据另一列提取R数据表中的唯一行

热门标签

归档