在R中从宽到长使用重塑

格里蒂

我正在尝试将R中的数据从宽变长。

我的宽格式数据如下所示:

我有以下数据矩阵:在各行中,我有不同的公司,在各列中,有不同年份的变量。(收入_2012,收入_2011,收入_2010,...,tot_assets_2012,tot_assets_2011等)。

我想将其重新排列为长格式:

仅具有以下列:公司,年份,变量(收入,tot_assets,..)

我已经尝试了好几天了。我还咨询了http://www.ats.ucla.edu/stat/r/faq/reshape.htm,但我无法理解他们如何重整数据以及如何分离年份。

预先感谢您的帮助。

问候

格里蒂

PS:由于我是R的新手,并且R本身提供的帮助似乎是技术性的,所以我很感谢您提出任何非常简单的介绍的提示。

A5C1D2H2I1M1N2O1R2T1

这是三个示例(连同一些我认为代表您所描述的示例数据)。

这是示例数据:

set.seed(1)
mydf <- data.frame(
  company = LETTERS[1:4],
  earnings_2012 = runif(4),
  earnings_2011 = runif(4),
  earnings_2010 = runif(4),
  assets_2012 = runif(4),
  assets_2011 = runif(4),
  assets_2010 = runif(4)
)

mydf
#   company earnings_2012 earnings_2011 earnings_2010 assets_2012 assets_2011 assets_2010
# 1       A     0.2655087     0.2016819    0.62911404   0.6870228   0.7176185   0.9347052
# 2       B     0.3721239     0.8983897    0.06178627   0.3841037   0.9919061   0.2121425
# 3       C     0.5728534     0.9446753    0.20597457   0.7698414   0.3800352   0.6516738
# 4       D     0.9082078     0.6607978    0.17655675   0.4976992   0.7774452   0.1255551

选项1: reshape

一个限制是它不能处理“不平衡的”数据集(例如,如果您没有“ assets_2010”作为数据的一部分,那么它将不起作用)。

reshape(mydf, direction = "long", idvar="company", 
        varying = 2:ncol(mydf), sep = "_")
#        company time   earnings    assets
# A.2012       A 2012 0.26550866 0.6870228
# B.2012       B 2012 0.37212390 0.3841037
# C.2012       C 2012 0.57285336 0.7698414
# D.2012       D 2012 0.90820779 0.4976992
# A.2011       A 2011 0.20168193 0.7176185
# B.2011       B 2011 0.89838968 0.9919061
# C.2011       C 2011 0.94467527 0.3800352
# D.2011       D 2011 0.66079779 0.7774452
# A.2010       A 2010 0.62911404 0.9347052
# B.2010       B 2010 0.06178627 0.2121425
# C.2010       C 2010 0.20597457 0.6516738
# D.2010       D 2010 0.17655675 0.1255551

选项2:“ reshape2”包

非常流行的语法。在需要工作之前,需要进行一些处理,因为需要拆分列名才能使我们获得这种“双倍宽”类型的数据。能够处理不平衡的数据,但是如果您变化的列具有不同的列类型(数字,字符,因子),那将不是最佳选择。

library(reshape2)
dfL <- melt(mydf, id.vars="company")
dfL <- cbind(dfL, colsplit(dfL$variable, "_", c("var", "year")))
dcast(dfL, company + year ~ var, value.var="value")
#    company year    assets   earnings
# 1        A 2010 0.9347052 0.62911404
# 2        A 2011 0.7176185 0.20168193
# 3        A 2012 0.6870228 0.26550866
# 4        B 2010 0.2121425 0.06178627
# 5        B 2011 0.9919061 0.89838968
# 6        B 2012 0.3841037 0.37212390
# 7        C 2010 0.6516738 0.20597457
# 8        C 2011 0.3800352 0.94467527
# 9        C 2012 0.7698414 0.57285336
# 10       D 2010 0.1255551 0.17655675
# 11       D 2011 0.7774452 0.66079779
# 12       D 2012 0.4976992 0.90820779

选项3:merged.stack来自“ splitstackshape”

merged.stack我的“ splitstackshape”包中的语法非常简单,如果需要使用这种“双倍宽”类型的结构,则应该很快。创建它是为了能够处理不平衡的数据,并且由于它单独处理列,因此在转换列类型时不会出现问题。

library(splitstackshape)
merged.stack(mydf, id.vars="company", 
             var.stubs=c("earnings", "assets"), sep = "_")
#     company .time_1   earnings    assets
#  1:       A    2010 0.62911404 0.9347052
#  2:       A    2011 0.20168193 0.7176185
#  3:       A    2012 0.26550866 0.6870228
#  4:       B    2010 0.06178627 0.2121425
#  5:       B    2011 0.89838968 0.9919061
#  6:       B    2012 0.37212390 0.3841037
#  7:       C    2010 0.20597457 0.6516738
#  8:       C    2011 0.94467527 0.3800352
#  9:       C    2012 0.57285336 0.7698414
# 10:       D    2010 0.17655675 0.1255551
# 11:       D    2011 0.66079779 0.7774452
# 12:       D    2012 0.90820779 0.4976992

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在熊猫中重塑从宽到长的形状

来自分类Dev

在R中从宽到长

来自分类Dev

复杂的重塑从宽到长

来自分类Dev

R中从宽到长的复杂重塑(从原始变量名中拉出多个东西)

来自分类Dev

重塑R中的数据帧:从宽到长,但“可变”列的长度不相等

来自分类Dev

如何重塑清单的清单,从宽到长

来自分类Dev

从宽到长格式/结构重塑

来自分类Dev

BigQuery重塑表格,结构从宽到长

来自分类Dev

从宽到长格式/结构重塑

来自分类Dev

从宽到长重塑调查数据集

来自分类Dev

重塑数据帧(从宽到长)

来自分类Dev

R重塑从宽到长:多个变量,具有多个指标的观察结果

来自分类Dev

R重塑从宽到长:多个变量,具有多个指标的观察结果

来自分类Dev

将列名中具有多个键的数据框从宽到长重塑

来自分类Dev

从宽到长收集数据帧,并使用R中的tidyverse生成新列

来自分类Dev

重塑包:data.frame从宽到长

来自分类Dev

如何重塑联合数据从宽到长?

来自分类Dev

用指示器向量从宽到长重塑

来自分类Dev

R从宽到长旋转多列

来自分类Dev

从宽到长

来自分类Dev

在折叠 R 中相同 ID 的变量值的同时,从宽数据到长数据进行整形

来自分类Dev

R:使用收集和扩展将时间序列数据集从宽到长转置

来自分类Dev

R使用pivot_longer将名称值对从宽到长整形

来自分类Dev

将不整洁和不平衡的数据集从宽范围重塑到长范围

来自分类Dev

R:从宽到长整形,无法正确订购

来自分类Dev

R:覆盖从宽格式到长格式的数据帧

来自分类Dev

R:从重塑到长塑

来自分类Dev

使用日期变量从宽格式到长格式

来自分类Dev

麻烦的df从宽到长

Related 相关文章

热门标签

归档