LME错误:“结构错误”

埃文

4个蜂箱配有传感器,可收集蜂箱内的温度,湿度,压力和分贝。这些是响应变量。

处理为wifi暴露,实验组从第1天到第20天,然后从第35-45天再次暴露于wifi,并收集数据直到第54天。n个蜂巢= 4,n个传感器收集的数据每个蜂巢=〜百万。

我在运行混合效果模型时遇到困难。

所有荨麻疹的响应变量都有一个数据框。

names(Hives)
[1] "time"           "dht22_t"        "dht11_t"        "dht22_h"       
[5] "dht11_h"        "db"             "pa"             "treatment_hive"
[9] "wifi"   

时间以“%Y-%m-%d%H:%M:%S”表示,dht11 / 22_t / h是温度和湿度数据。“ wifi”是与暴露时间相对应的二分变量(1 =开0 =关),而处理单元是暴露于wifi的蜂巢的另一二分变量(1 =暴露,0 =对照)。

这是我遇到的错误。

attach(Hives)
model2 = lme(pa_t~wifi*treatment_hive, random=time, na.action=na.omit, method="REML",)

Error in reStruct(random, REML = REML, data = NULL) : 
Object must be a list or a formula

这是代码示例:

    time    dht22_t dht11_t dht22_h dht11_h db  pa  treatment_hive  wifi
1   01/09/2014 15:19    NA      NA  NA      NA  51.75467    NA      0   1
2   01/09/2014 15:19    30.8    31  59.8    44  55.27682    100672  0   1
3   01/09/2014 15:19    30.8    31  60.3    44  54.81995    100675  0   1
4   01/09/2014 15:19    30.8    31  60.9    44  54.14134    100671  0   1
5   01/09/2014 15:19    30.8    31  61.1    44  53.88574    100672  0   1
6   01/09/2014 15:19    30.8    31  61.2    44  53.68800    100680  0   1

R版本2.15.1(2012-06-22)平台:i486-pc-linux-gnu(32位)
附加软件包:[1] ggplot2_0.8.9 proto_0.3-9.2 reshape_0.8.4 plyr_1.7.1 nlme_3.1- 104
[6] lme4_0.999999-0 Matrix_1.0-6点阵_0.20-6

本·博克

这里有各种各样的问题,其中一些与编程有关(StackOverflow),但统计上的问题(适合CrossValidated[email protected])可能更为重要。

tl; dr如果您只是想避免该错误,我认为您需要random=~1|hive(无论您的配置单元变量是什么)都适合一个模型,该模型的基线响应(拦截)在蜂巢中有所不同,但我建议您继续阅读...

  • 我们可以一个(小!)可复制的例子吗?
  • 不要使用attach(Hives),请data=Hiveslme()通话中使用(不一定是问题,而是[更好的做法])
  • 仅具有4个蜂箱,是否有一个适用于蜂箱的随机效果规范是否会产生疑问(尽管使用一百万个观察值,您可能会避开它)
  • 随机效应必须由分类(因子)分组变量组成;在您的情况下,我认为“配置单元”是分组变量,但是我无法从您的问题中看出哪个变量标识了荨麻疹
  • 您几乎应该肯定有一个模型,该模型考虑了蜂巢的时间趋势和时间趋势的变化,即随机斜率模型,其表示为formula=...~...+time, random=~time|hive(其中...代表现有模型的位)
  • 您必须将时间转换为明智的方式,以便在模型中使用它(请参见?strptimelubridate包装),从开始时间开始的秒/分钟/小时之类的时间可能最明智。(您的时间分辨率是多少?每个配置单元中是否有多个传感器,在这种情况下,您还应考虑随机安装传感器的效果?)
  • 有数百万个数据点,您的模型拟合可能很慢;您可能要考虑lme4包装
  • 拥有数百万个数据点,那么所有数据都将具有统计意义,并且对数据中未出现的模型方面非常敏感,例如(1)时间的非线性趋势(例如,考虑将时间趋势的附加模型与mgcv::gammgamm4包装);(2)时间自相关(考虑correlationlme模型中添加参数)。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章