因此,我有两个熊猫时间序列,并且两者的索引都是时间戳。问题是-并非所有时间戳都同时存在于两个时间序列中。我想对匹配的点执行线性回归,而忽略那些没有“对”的点
这是我当前的解决方案,但似乎有些冗长和丑陋:
indexes_used = sorted(list(set(series1).intersection(series2)))
perform_regression(series1.loc[indexes_used], series2.loc[indexes_used])
另外,我正在考虑这样做(但是创建一个临时数据帧似乎是多余的):
temp_frame = pd.concat([series1, series2]).T.dropna() #need the transpose to keep timestamps on vertical axis
perform_regression(blabla)
有什么好方法吗?
怎么样Series.align
:
import pandas as pd
a = pd.Series([4, 5, 6, 7], index=[1, 2, 3, 4])
b = pd.Series([49, 54, 62, 74], index=[2, 6, 4, 0])
a2, b2 = a.align(b, join="inner")
输出:
2 5
4 7
dtype: int64
2 49
4 62
dtype: int64
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句