使用R计算大型数据集中每行的斜率

Anita 发表于 Dev

安妮塔

我有很多data set以下内容format：第一列是type，发生的subsequent columns时间不同'type'。我想每个计算的斜率row (~7000 rows)为subset T0-T2，然后t0-t2输出信息，然后获得平均的斜坡每一行。例如，获取类型1的子集T0-T2和t0-t2的斜率，然后获取行type1的两个值的平均值。有些行完全丢失了数据，而有些行则丢失了一个或两个值。

Type    T0   T1   T2   t0   t1   t2  
type1  0.2  0.3  0.4  0.3  0.2  0.1 
type2  1.4  2.5  3.4  1.5  0.5  3.4
type3  0.4  8.1  8.1       2.2
type4        
...

我是的初学者R，因此尝试这样做一直很困难，就我看来，这似乎很简单。我在缺失值（NA）中遇到错误，对于本网站上类似问题的任何想法或指导，我将不胜感激。谢谢

乔索普

首先，您可能想编写一个可以计算三个连续值的斜率的函数，如下所示：

slope  <-  function(x){
    if(all(is.na(x)))
        # if x is all missing, then lm will throw an error that we want to avoid
        return(NA)
    else
        return(coef(lm(I(1:3)~x))[2])
}

然后可以使用该apply()函数计算每一行的斜率（MARGIN = 1），如下所示：

df <- read.csv(text = 
"Type,T0,T1,T2,t0,t1,t2
type1,0.2,0.3,0.4,0.3,0.2,0.1 
type2,1.4,2.5,3.4,1.5,0.5,3.4
type3,0.4,8.1,8.1,,2.2,")


df$slope1  <-  
    apply(df[,c('T0','T1','T2')],
          1,
          slope)

df$slope2  <-  
    apply(df[,c('t0','t1','t2')],
          1,
          slope)

然后计算平均斜率：

df$average.slope  <-  (df$slope1 + df$slope2)/2

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-20

我来说两句

0条评论

登录后参与评论

来自分类Dev

R 提高嵌套 for() 循环的效率，以便在大型数据集中进行简单的距离计算

来自分类Dev

如何提高大型数据集中Python计算的速度？

来自分类Dev

使用R删除大型数据集中的一些特殊列

来自分类Dev

R-在大型数据集中重复线性回归

来自分类Dev

计算大R数据集中的对数

来自分类Dev

使用列值从大型数据集中选择特定行

来自分类Dev

使用循环和grepl从大型数据集中删除几行

来自分类Dev

使用mysql计算数据集中的峰

来自分类Dev

如何从pandas数据框中的每日大型JSON数据集中计算平均每月价值？

来自分类Dev

R：从复杂的数字/字符串混合数据集中的字符串数据的多个变量中提取数字的斜率

来自分类Dev

使用跨越数年的大型数据集计算R中的月平均值

来自分类Dev

从大型点数据集中计算附近点的最快方法是什么

来自分类Dev

从大型点数据集中计算附近点的最快方法是什么

来自分类Dev

使用R计算大数据集中每一行的情绪

来自分类Dev

如何计算R中数据框中每行的条目数？

来自分类Dev

R计算（分层）长数据集中的时间差

来自分类Dev

R计算（分层）长数据集中的时间差

来自分类Dev

大型数据集中的选择/投影/分组

来自分类Dev

从大型数据集中逐步构建箱线图

来自分类Dev

填补大型数据集中的时间戳空白

来自分类Dev

识别大型数据集中的重复项

来自分类Dev

使用计算值填充大型数据框

来自分类Dev

从大型数据集中的R中的data.frame获取排序的前N个元素

来自分类Dev

在R中大型数据集中的多个列之间自动执行grep（）

来自分类Dev

R：用于对大型数据集中包含特定字符的列的非NA值求和的功能或类似功能

来自分类Dev

计算一个大型数据库的一系列子集中的新变量

来自分类Dev

如何为大型数据集中的每十个数字中的一组计算模式（统计）

来自分类Dev

使用行和列名称从大型数据集中过滤掉重要匹配

来自分类Dev

计算大熊猫数据帧上的滚动斜率

Related 相关文章

文章