如何使用for循环创建和填充列？

debugcn 发表于 Dev

资料人

我有一个包含10个变量的简单时间序列数据集-我想创建一个for循环（或函数），为该时间序列中的每个变量创建一个“与上个月变量相比变化”和一个“与上个月变量相比变化百分比”（除日期外）。我知道我可以为每个特定的列简单地编写代码，但是由于有很多列，所以我想对其进行优化。

这是我的数据，“日期”，“销售”，“价格”是一些列名称：

+----+---+---+---+---+---+---+---+--
| Date       |   Sales   |  Price  | 
+----+---+---+---+---+---+---+---+--
| 01Aug2019  | 4         | 15      |
| 01Sept2019 | 6         | 30      |
| 01Oct2019  | 10        | 44      |
+----+---+---+---+---+---+---+---+--

这是我希望使用for循环（或任何函数）的样子

+----+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+
| Date       |   Sales   |  chg_Sales  | pct_chg_Sales |   Price |  chg_Price  | pct_chg_Price| 
+----+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+
| 01Aug2019  | 4         | NA          |NA             |  15     | NA          |NA            |
| 01Sept2019 | 6         | 2           |50%            |  30     | 15          |100%          |
| 01Oct2019  | 10        | 4           |66%            |  44     | 14          |46%           |
+----+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+

我尝试了下面的代码，但是没有用

add_column <- function (x, y){
  setDT (x)[,pct_chg_y:= (y - shift (y,1, type="lag")/shift (,1, type="lag")*100]

}

阿克伦

下面是一个选项data.table，其中我们指定的兴趣的列.SDcols，通过减去创建“chg_”列.SD从（Data.table的子集）lag，即shift的.SD，然后在第二步骤中，创建“pct_chg，通过将shift与“ chg_”列使用Map

nm1 <- c("Sales", "Price")
setDT(df1)[,  paste0("chg_", nm1)  :=  .SD - shift(.SD), .SDcols = nm1]
df1[, paste0("pct_chg_", nm1) :=   
      Map(function(x, y)  100 * (y/shift(x)), .SD, mget(paste0("chg_", nm1))),
               .SDcols = nm1]
df1
#         Date Sales Price chg_Sales chg_Price pct_chg_Sales pct_chg_Price
#1:  01Aug2019     4    15        NA        NA            NA            NA
#2: 01Sept2019     6    30         2        15      50.00000     100.00000
#3:  01Oct2019    10    44         4        14      66.66667      46.66667

数据

df1 <- structure(list(Date = c("01Aug2019", "01Sept2019", "01Oct2019"
), Sales = c(4, 6, 10), Price = c(15, 30, 44)), 
        class = "data.frame", row.names = c(NA, 
-3L))

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-2

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

如何使用for循环创建和填充列？

如何使用for循环创建和填充列？

数据

如何使用for循环创建和填充如下所示的结构？物镜

根据另一个数据帧中的值使用循环创建和填充多列

如何使用Java在HDFS中创建和填充Parquet文件？

如何使用 GeoTools API 创建和填充 shp 文件

如何使用数组在for循环中创建和保留变量？

尝试使用for循环创建和填充矢量时出现超出范围的错误（C ++）

尝试使用for循环创建和填充矢量时出现超出范围的错误（C ++）

使用for循环创建和分配不同的变量

使用docker-compose时如何创建和填充wso2数据库表？

如何使用动态构建的 lambda 表达式创建和填充动态对象

对于循环R，使用输出创建并填充新列

在R中的数据框中创建和填充列

如何使用python中的两个循环创建和追加多行

如何使用python中的两个循环创建和追加多行

如何从Mysql数据库创建和填充php数组

使用PHP动态创建和填充输入广播

使用javascript动态创建和填充数组

使用PHP动态创建和填充输入单选

使用旧条目创建和填充新词典

使用for循环在Tkinter中创建和使用小部件（缩放）

如何创建和使用vapi文件？

BIRT变量-如何创建和使用？

如何创建和使用OCaml模块？

如何使用pyWikiBot创建和/或编辑页面

如何创建和使用OCaml模块？

如何创建和使用查找表

如何使用滑块创建和销毁对象？

如何在python for循环中创建和删除类实例

使用for循环创建和命名多个并发线程