R：如何在数据框中创建一个新列，从基数上计算观察值对变量具有相同值的次数

debugcn 发表于 Dev

洛伦佐·卡佩利（Lorenzo Capelli）

我有超过15,000行的R数据框，如下所示：

+------------------------------------+-------+
|  Authors                           | IDs   |
+------------------------------------+-------+
|  Abad J., Cabrera H.R., Medina A.  | 16400 |
|  Abad J., Cabrera H.R., Medina A.  | 70058 |
|  Abad J., Cabrera H.R., Medina A.  | 71030 |
|  A Banuls V., Salmeron J.L.        | 57196 |
|  A Banuls V., Salmeron J.L.        | 56372 |
+------------------------------------+-------+

我想获得的是以下新列：

+------------------------------------+-------+-------+
|  Authors                           | IDs   |Order  |
+------------------------------------+-------+-------+
|  Abad J., Cabrera H.R., Medina A.  | 16400 |   1   |
|  Abad J., Cabrera H.R., Medina A.  | 70058 |   2   |
|  Abad J., Cabrera H.R., Medina A.  | 71030 |   3   |
|  A Banuls V., Salmeron J.L.        | 57196 |   1   | 
|  A Banuls V., Salmeron J.L.        | 56372 |   2   |
+------------------------------------+-------+-------+

基本上我想要一个新的列，其中计算具有相同作者的观察次数。

有什么猜想吗？

阿克伦

我们可以按“作者”进行分组并获得 row_number()

library(dplyr)
df1 %>%
  group_by(Authors)%>%
  mutate(order = row_number())

或搭配 ave

df1$order <- with(df1, ave(seq_along(Authors), Authors, FUN = seq_along))

或者，如果“作者”按字母顺序排列

df1$order <- sequence(table(df1$Authors))

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-2

我来说两句

0条评论

登录后参与评论

来自分类Dev

如何在R中创建一个新变量，如果一个案例缺少一个值而另一个变量具有一个观察到的值，则返回1？

来自分类Dev

在数据框中创建一个新变量并一步更改其值

来自分类Dev

如何在数据框中创建一个新列，其值表示某个列中的值所属的范围？

来自分类Dev

如何在R中创建一个计算唯一值的新列

来自分类Dev

我将如何创建一个具有aa列的唯一值并对其进行计数的新数据框？

来自分类Dev

如何创建一个等于R数据框中另一个列的前5个观察值的乘积的列？

来自分类Dev

根据熊猫中另一列上的值在数据框中创建一个新列

来自分类Dev

如何在数据框的列上使用R的diff函数，条件是在另一列中具有特定值

来自分类Dev

熊猫：在数据框的最后一行添加一个具有单个值的新列

来自分类Dev

在数据框的一列中找到相同的值，并为每个重复的数据创建一个新的数据框

来自分类Dev

如何在R中每n行创建一个具有相同ID的新列？

来自分类Dev

如何在数据框的中间添加具有基于前一列的值的新列？

来自分类Dev

根据另一个数据框中的值计算一个数据框中的观察次数

来自分类Dev

我如何在pyspark中创建一个新列，其中行值相同？

来自分类Dev

如何在数据框中为列查找具有相同值（字符串）的两个连续行并在它们之间添加更多行？

来自分类Dev

如何创建一个新列，显示是否以及多少变量共享特定观察值

来自分类Dev

如何在R中具有mutate函数的数据框中基于另一个二进制变量创建一个新的二进制变量？

来自分类Dev

如何在熊猫数据框中为每个公司的去年观察值创建一个虚拟对象？

来自分类Dev

根据第一个数据框Java中的列创建具有新列值的新Spark DataFrame

来自分类Dev

如何在一个或多个列中查找具有完全相同值的行

来自分类Dev

如何在另一个表ssms中更新具有相同值的列？

来自分类Dev

创建一个新列以标识两列是否相同，但在第三列中具有不同的值

来自分类Dev

熊猫：如何将具有相同列值的几行组合在一起，并创建一个涵盖所有可能性的新数据框？

来自分类Dev

从具有多个值的行中随机选择1个值；用清除的数据创建一个新列

来自分类Dev

R-创建一个新变量，其中每个观察值都依赖于另一个表和数据框中的其他变量

来自分类Dev

您如何子集一个在R中具有多个重复值的数据框

来自分类Dev

如果一列在数据框中具有多个值，则创建多行

来自分类Dev

如何创建公式以考虑数据框中的名称及其列值来计算R中的新变量

来自分类Dev

计算数据框中的特定值并创建具有总和的新列

Related 相关文章

文章