我在R中有一个数据集(320万行),它由时间(毫秒)和伏特对组成。收集数据的传感器仅在一天中运行,因此时间实际上是从当天启动以来的毫秒数。
例如,如果传感器每天运行12个小时,则一天的最大可能时间值为43,200,000 ms(12h * 60m * 60s * 1000ms
)。
数据不断添加到单个文件中,这意味着有很多重叠的时间值:
X: [1,2,3,4,5,1,2,3,4,5,1,2,3,4,5...] // example if range was 1-5 for one day
Y: [voltage readings at each point in time...]
我想将每个“运行”分成唯一的数据框,以便可以清楚地看到各个日子。目前,当我绘制整个数据集时,它是令人难以置信的泥泞,因为实际上所有的日子都显示在单个图中。谢谢你的帮助。
如果您的data.framedf
有X
和列Y
,则可以使用diff
来查找每次X
下降(这意味着新的一天,听起来像):
df$Day = cumsum(c(1, diff(df$X) < 0))
Day1 = df[df$Day==1,]
plot(Day1$X, Day1$Y)
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句