数据框与旋转值的相关性(循环?)

吴江

我有一个以下格式的数据框,我正在尝试创建 df['New'] ,它是一个旋转值,如下所示,我将用它来计算 Alpha 和 New 之间的相关性

Date       Alpha Bravo Charlie   New                         Correlation
2018-01-03    1     3      2       3 (from bravo column)          NaN
2018-01-04    2     6      4       6 (from bravo column)          NaN
2018-01-05    3     9      6       9 (from bravo column)          NaN
2018-01-06    4    12      8      12 (from bravo column)          NaN
2018-01-07    5    15     10      10 (from Charlie column)         X

下一个日期:

Date       Alpha Bravo Charlie   New                         Correlation
2018-01-03    1     3      2       3 (from bravo column)          NaN
2018-01-04    2     6      4       6 (from bravo column)          NaN
2018-01-05    3     9      6       9 (from bravo column)          NaN
2018-01-06    4    12      8      12 (from bravo column)          NaN
2018-01-07    5    15     10      15 (from bravo column)           X  
2018-01-08    6    18     12      12 (from Charlie column)         Y

df['Correlation'] = df['Alpha'].rolling(window=5).corr(other=df['New'])

任何建议我如何创建这个带有旋转值的新列?(这样我之前的相关性将保持不变为 X。我的最终目标是获得相关性列,而新列仅用于计算相关性)

换句话说,每次计算相关列时,它都会使用最新的值作为 Charlie,但使用所有之前的值作为 Bravo。

解释这一点的另一种方法是,将始终使用 Charlie 专栏的最后日期和过去 4 天的 bravo 来计算与 Alpha 的相关性,如下所示:

在此处输入图片说明

耶斯列

我认为你需要先添加NaNs 然后这个解决方案strides然后得到相关矩阵:

def rolling_window(a, window):
    shape = a.shape[:-1] + (a.shape[-1] - window + 1, window)
    strides = a.strides + (a.strides[-1],)
    return np.lib.stride_tricks.as_strided(a, shape=shape, strides=strides)

N = 5
a = np.concatenate([[np.nan] * (N-1), df['Bravo'].values])
b = np.concatenate([[np.nan] * (N-1), df['Alpha'].values])
a1 = rolling_window(a, N)
a2 = rolling_window(b, N)

删除最后一列a1并添加列的Charlie

c = np.c_[a1[:, :-1], df['Charlie'].values[:, None]] 
print (c)
[[nan nan nan nan  2.]
 [nan nan nan  3.  4.]
 [nan nan  3.  6.  6.]
 [nan  3.  6.  9.  8.]
 [ 3.  6.  9. 12. 10.]
 [ 6.  9. 12. 15. 12.]
 [ 9. 12. 15. 18. 15.]]

创建 DataFrames 并NaN通过iloc以下方式删除前s 行

a = pd.DataFrame(a2, index=df.index).iloc[N-1:]
b = pd.DataFrame(c, index=df.index).iloc[N-1:]
df['Correlation1'] = a.corrwith(b, axis=1)
#for improve performance
#https://stackoverflow.com/a/41703623/2901002
df['Correlation2'] = corr2_coeff_rowwise(a2, c)

print (df)
        Date  Alpha  Bravo  Charlie  Correlation1  Correlation2
0 2018-01-03      1      3        2           NaN           NaN
1 2018-01-04      2      6        4           NaN           NaN
2 2018-01-05      3      9        6           NaN           NaN
3 2018-01-06      4     12        8           NaN           NaN
4 2018-01-07      5     15       10      0.894427      0.894427
5 2018-01-08      6     18       12      0.832050      0.832050
6 2018-01-09      7     21       15      0.832050      0.832050

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

for循环可在2个不同的数据框中查找相同变量(列)之间的相关性

来自分类Dev

按组创建具有相关性和p值的数据框?

来自分类Dev

两个数据框之间的相关性

来自分类Dev

不同数据框的列之间的相关性

来自分类Dev

计算 R 数据框列之间的相关性

来自分类Dev

如何从相关表中提取相关性,并建立具有最大相关性的成对数据框?

来自分类Dev

查找其名称被指定为另一个数据框中的值的列之间的相关性

来自分类Dev

使用group_by创建相关性和p值的数据框,然后使用R中的误差线进行绘制

来自分类Dev

如何在for循环中存储来自for循环的数据?(r中的滚动相关性)

来自分类Dev

R 中的相关性 - 缺失值

来自分类Dev

数据帧中子集的相关性

来自分类Dev

数据框熊猫中所有行的皮尔逊相关性

来自分类Dev

熊猫数据框将特征划分为高相关性组

来自分类Dev

在两个以上数据框内的相同变量的嵌套列表内循环相关性测试

来自分类Dev

使用循环根据R中的子集数据计算相关性

来自分类Dev

在python中绘制同比价格相关性。(绘制数据帧行的相关性)

来自分类Dev

循环相关性错误自动加载常量

来自分类Dev

FOR 循环问题以及 IP 地址的相关性

来自分类Dev

布尔值和连续值之间的相关性

来自分类Dev

如何使用相关性或协方差矩阵而不是使用R的数据框获得回归系数和模型拟合?

来自分类Dev

R中的文本挖掘,术语图与值的相关性

来自分类Dev

NA介于值之间->错误的相关性和情节?

来自分类Dev

在Altair中向散点图添加R值(相关性)

来自分类Dev

没有左右边界的值的Jmeter相关性

来自分类Dev

计算单独的相关性,按列值分组

来自分类Dev

计算R中函数生成的数据的相关性

来自分类Dev

SQL分组数据和设置相关性

来自分类Dev

在R中的数据帧中计算相关性

来自分类Dev

r中矩阵格式的数据的相关性

Related 相关文章

  1. 1

    for循环可在2个不同的数据框中查找相同变量(列)之间的相关性

  2. 2

    按组创建具有相关性和p值的数据框?

  3. 3

    两个数据框之间的相关性

  4. 4

    不同数据框的列之间的相关性

  5. 5

    计算 R 数据框列之间的相关性

  6. 6

    如何从相关表中提取相关性,并建立具有最大相关性的成对数据框?

  7. 7

    查找其名称被指定为另一个数据框中的值的列之间的相关性

  8. 8

    使用group_by创建相关性和p值的数据框,然后使用R中的误差线进行绘制

  9. 9

    如何在for循环中存储来自for循环的数据?(r中的滚动相关性)

  10. 10

    R 中的相关性 - 缺失值

  11. 11

    数据帧中子集的相关性

  12. 12

    数据框熊猫中所有行的皮尔逊相关性

  13. 13

    熊猫数据框将特征划分为高相关性组

  14. 14

    在两个以上数据框内的相同变量的嵌套列表内循环相关性测试

  15. 15

    使用循环根据R中的子集数据计算相关性

  16. 16

    在python中绘制同比价格相关性。(绘制数据帧行的相关性)

  17. 17

    循环相关性错误自动加载常量

  18. 18

    FOR 循环问题以及 IP 地址的相关性

  19. 19

    布尔值和连续值之间的相关性

  20. 20

    如何使用相关性或协方差矩阵而不是使用R的数据框获得回归系数和模型拟合?

  21. 21

    R中的文本挖掘,术语图与值的相关性

  22. 22

    NA介于值之间->错误的相关性和情节?

  23. 23

    在Altair中向散点图添加R值(相关性)

  24. 24

    没有左右边界的值的Jmeter相关性

  25. 25

    计算单独的相关性,按列值分组

  26. 26

    计算R中函数生成的数据的相关性

  27. 27

    SQL分组数据和设置相关性

  28. 28

    在R中的数据帧中计算相关性

  29. 29

    r中矩阵格式的数据的相关性

热门标签

归档