LME错误：“结构错误”

evan 发表于 Dev

埃文

4个蜂箱配有传感器，可收集蜂箱内的温度，湿度，压力和分贝。这些是响应变量。

处理为wifi暴露，实验组从第1天到第20天，然后从第35-45天再次暴露于wifi，并收集数据直到第54天。n个蜂巢= 4，n个传感器收集的数据每个蜂巢=〜百万。

我在运行混合效果模型时遇到困难。

所有荨麻疹的响应变量都有一个数据框。

names(Hives)
[1] "time"           "dht22_t"        "dht11_t"        "dht22_h"       
[5] "dht11_h"        "db"             "pa"             "treatment_hive"
[9] "wifi"

时间以“％Y-％m-％d％H：％M：％S”表示，dht11 / 22_t / h是温度和湿度数据。“ wifi”是与暴露时间相对应的二分变量（1 =开0 =关），而处理单元是暴露于wifi的蜂巢的另一二分变量（1 =暴露，0 =对照）。

这是我遇到的错误。

attach(Hives)
model2 = lme(pa_t~wifi*treatment_hive, random=time, na.action=na.omit, method="REML",)

Error in reStruct(random, REML = REML, data = NULL) : 
Object must be a list or a formula

这是代码示例：

    time    dht22_t dht11_t dht22_h dht11_h db  pa  treatment_hive  wifi
1   01/09/2014 15:19    NA      NA  NA      NA  51.75467    NA      0   1
2   01/09/2014 15:19    30.8    31  59.8    44  55.27682    100672  0   1
3   01/09/2014 15:19    30.8    31  60.3    44  54.81995    100675  0   1
4   01/09/2014 15:19    30.8    31  60.9    44  54.14134    100671  0   1
5   01/09/2014 15:19    30.8    31  61.1    44  53.88574    100672  0   1
6   01/09/2014 15:19    30.8    31  61.2    44  53.68800    100680  0   1

R版本2.15.1（2012-06-22）平台：i486-pc-linux-gnu（32位）
附加软件包：[1] ggplot2_0.8.9 proto_0.3-9.2 reshape_0.8.4 plyr_1.7.1 nlme_3.1- 104
[6] lme4_0.999999-0 Matrix_1.0-6点阵_0.20-6

本·博克

这里有各种各样的问题，其中一些与编程有关（StackOverflow），但统计上的问题（适合CrossValidated或[email protected]）可能更为重要。

tl; dr如果您只是想避免该错误，我认为您需要random=~1|hive（无论您的配置单元变量是什么）都适合一个模型，该模型的基线响应（拦截）在蜂巢中有所不同，但我建议您继续阅读...

我们可以举一个（小！）可复制的例子吗？
不要使用attach(Hives)，请data=Hives在lme()通话中使用（不一定是问题，而是[更好的做法]）
仅具有4个蜂箱，是否有一个适用于蜂箱的随机效果规范是否会产生疑问（尽管使用一百万个观察值，您可能会避开它）
随机效应必须由分类（因子）分组变量组成；在您的情况下，我认为“配置单元”是分组变量，但是我无法从您的问题中看出哪个变量标识了荨麻疹
您几乎应该肯定有一个模型，该模型考虑了蜂巢的时间趋势和时间趋势的变化，即随机斜率模型，其表示为formula=...~...+time, random=~time|hive（其中...代表现有模型的位）
您必须将时间转换为明智的方式，以便在模型中使用它（请参见?strptime或lubridate包装），从开始时间开始的秒/分钟/小时之类的时间可能最明智。（您的时间分辨率是多少？每个配置单元中是否有多个传感器，在这种情况下，您还应考虑随机安装传感器的效果？）
有数百万个数据点，您的模型拟合可能很慢；您可能要考虑lme4包装
拥有数百万个数据点，那么所有数据都将具有统计意义，并且对数据中未出现的模型方面非常敏感，例如（1）时间的非线性趋势（例如，考虑将时间趋势的附加模型与mgcv::gamm或gamm4包装）；（2）时间自相关（考虑correlation在lme模型中添加参数）。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-16

我来说两句

0条评论

登录后参与评论

上一篇：Python numpy nan与带有字符串的数组中的true比较

来自分类Dev

Related 相关文章

文章