假设我有以下不平衡Pandel数据:
unbalanced.panel = structure(list(firm = c("A", "A", "A", "A", "B", "B", "A", "A",
"B", "C", "C"), ind = c(1, 1, 1, 1, 2, 2, 2, 2, 1, 1, 1), year = c(2010,
2011, 2012, 2013, 2011, 2013, 2011, 2012, 2010, 2012, 2013),
charac1 = c("x", "x", "x", "x", "y", "y", "z", "z", "g",
"h", "h"), var1 = c(11, 12, 13, 14, 15, 18, 15, 29, 31, 13,
2)), row.names = c(NA, -11L), class = c("tbl_df", "tbl",
"data.frame"))
firm ind year charac1 var1
<chr> <dbl> <dbl> <chr> <dbl>
1 A 1 2010 x 11
2 A 1 2011 x 12
3 A 1 2012 x 13
4 A 1 2013 x 14
5 B 2 2011 y 15
6 B 2 2013 y 18
7 A 2 2011 z 15
8 A 2 2012 z 29
9 B 1 2010 g 31
10 C 1 2012 h 13
11 C 1 2013 h 2
其中,每个唯一的组(个体)用的组合来标识firm
和ind
,即个体“A1”是从“A2”个别不同。时间索引由year
变量给出。
我想要的是平衡总数据(指数=(个人=公司指数,时间=年)),用NA填补隐性的缺失缺口。
预期结果如下:
firm ind year charac1 var1
<chr> <dbl> <dbl> <chr> <dbl>
1 A 1 2010 x 11
2 A 1 2011 x 12
3 A 1 2012 x 13
4 A 1 2013 x 14
5 B 2 2010 y NA
6 B 2 2011 y 15
7 B 2 2012 y NA
8 B 2 2013 y 18
9 A 2 2010 z NA
10 A 2 2011 z 15
11 A 2 2012 z 29
12 A 2 2013 z NA
13 B 1 2010 g 31
14 B 1 2011 g NA
15 B 1 2012 g NA
16 B 1 2013 g NA
17 C 1 2010 h NA
18 C 1 2011 h NA
19 C 1 2012 h 13
20 C 1 2013 h 2
我尝试使用,plm::make.pbalanced(unbalanced.panel, balance.type = "fill")
但出现以下错误:
模式错误<-(tmp,value = id_orig_typeof):无效以更改因子的存储模式
我什至尝试使用tidyr::complete()
,但是这并不能达到我想要的平衡面板。
这些是我的要求:当唯一的个人(firm-ind)缺少年份行时,必须使用NA填充时变变量(var1),但是应使用唯一的变量填充时变变量,例如特征(charact1)值。
方法有什么问题tidyr::complete()
?它不允许我区分要填充或扩展的时不变变量和时变变量。而且它不能识别唯一的个人索引(在这种情况下为牢固索引)。
unbalanced.panel >%>
tidyr::complete(firm, year, nesting(var1))
上面的代码使出现一个新的单独的“ C2”,并用NA填充时不变变量。
我们可以complete
从tidyr
包装中使用。关键是要nesting
正确设置。
library(dplyr)
library(tidyr)
balanced.panel <- unbalanced.panel %>%
complete(nesting(firm, ind, charac1), year = full_seq(year, period = 1))
balanced.panel
# # A tibble: 20 x 5
# firm ind charac1 year var1
# <chr> <dbl> <chr> <dbl> <dbl>
# 1 A 1 x 2010 11
# 2 A 1 x 2011 12
# 3 A 1 x 2012 13
# 4 A 1 x 2013 14
# 5 A 2 z 2010 NA
# 6 A 2 z 2011 15
# 7 A 2 z 2012 29
# 8 A 2 z 2013 NA
# 9 B 1 g 2010 31
# 10 B 1 g 2011 NA
# 11 B 1 g 2012 NA
# 12 B 1 g 2013 NA
# 13 B 2 y 2010 NA
# 14 B 2 y 2011 15
# 15 B 2 y 2012 NA
# 16 B 2 y 2013 18
# 17 C 1 h 2010 NA
# 18 C 1 h 2011 NA
# 19 C 1 h 2012 13
# 20 C 1 h 2013 2
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句