使用 R，如何使用现有数据框中列的中位数创建新数据集？

debugcn 发表于 Dev

用户3115933

我是新来的R和我想从我的一个新的数据集dataframe，其中将包括它代表了一个新的列median值的现有列的（所谓的总额外）dataframe。后者由大约 5,000 个单独的观察结果组成。我对如何继续执行此任务感到有些困惑，因为需要根据以下标准计算中位数：财产、月份、年份和市场

目前，我的dataframe（我们称之为 mydata1）如下（显示前 5 行）：

Property    Date      Month  Year      Market    TotalExtras
ZIL         1-Jan-15    1    2015        UK         450.00
ZIL         1-Jan-15    1    2015        UK         125.00
ZIL         1-Feb-15    2    2015        UK         300.00
ZIL         1-Feb-16    2    2016        FR         225.00
EBA         1-Feb-15    2    2015        UK         150.00
...

我需要我的 R 代码来创建一个新的dataframe（我们称之为 mydata2），如下所示：

   Property        Date      Month  Year      Market    MedianTotalExtras
     ZIL         1-Jan-15      1    2015        UK         175.00
     ZIL         1-Feb-15      2    2015        UK         250.00
     ZIL         1-Feb-16      2    2016        FR         400.00
     EBA         1-Feb-15      2    2015        UK         328.00
     ...

上图仅供说明之用。基本上，mydata2 正在根据 Property、Date 和 Market 重新分组数据，用列“Median Total Extras”替换 mydata1 的“TotalExtras”列。

这可以用R完成吗？

保罗·希姆斯特拉

在dplyr一般的要点将是这样的：

mydata1 %>% 
    group_by(Property, Date, Market) %>% 
    summarise(MedianTotalExtras = median(TotalExtras))

wheregroup_by将数据集切割成具有唯一Property, Date,Market组合的部分，summarise+median计算中位数。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-10

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

使用 R，如何使用现有数据框中列的中位数创建新数据集？

使用 R，如何使用现有数据框中列的中位数创建新数据集？

如何在现有数据集上使用替代/新本体

创建预定义文本的字符向量列，并使用rbind或bind_rows将其绑定到现有数据框

使用dplyr将数据框中的中位数分组

R使用R根据现有列为数据框创建新列

使用R中现有列中的数据创建新列

如何使用现有数组的元素创建新数组？

在Spark SQL中使用别名值从现有数据框创建另一个数据框

如何使用if else语句基于str值在r数据框中创建新列？

使用另一个数据框的行号从现有数据框创建新的pandas数据框

使用现有数据框中的值的新数据框

使用Scala中数据框中的现有数据在数据框中创建arraytype列

使用Python从Pandas数据框中的现有日期时间列创建星期几列

如何使用数据框中的2列提取数据并使用Python创建新列？

我正在尝试将mutate函数与条件结合使用，以根据现有数据创建新列

使用Purrr从现有数据框中生成新数据框

使用两个for循环和if语句在现有数据框中填充新列

如何使用R中的分组交易创建新的数据框？

使用数学和现有列在熊猫数据框中创建新值

我正在使用Slugalicious宝石。如何为数据库中的现有数据创建块？

如何使用c＃中的现有数据库创建新数据库？

laravel-使用现有数据创建新的迁移表

使用条件从数据框中的现有变量创建一个新变量

如何使用自定义函数在现有数据框中创建新的二进制变量？

如何使用另一个数据库中的变量在现有数据库中创建新的二进制列？

如何遍历 R 数据框中的列并在每次迭代中使用列名创建新数据框？

使用数据子集时如何在data.table中创建新列并计算中位数

使用字符串列表或字典基于数据框中的现有列创建新列

Python：根据给定的索引使用现有 df 中的行创建新数据框

如何使用现有数据框的具体信息生成新数据框