这是我的数据框:
df = pd.DataFrame({'sym': ['a', 'b'], 'vol_1': [100, 50], 'price_1': [5, 150], 'vol_2': [1500, 2000], 'price_2': [20, 175],
'vol_3': [123, 500], 'price_3': [22, 1000], 'min': [18, 150], 'max': [23, 176]})
我想增加一列,资金vol_1
,vol_2
以及vol_3
为每一行,如果这是在每个卷下一列价格在范围min
和max
COLS。例如,对于我想要的第一行vol_2
,vol_3
因为价格在min
和的范围内max
。我期望的结果如下所示:
sym vol_1 price_1 vol_2 price_2 vol_3 price_3 min max vol_sum
0 a 100 5 1500 20 123 22 18 23 1623
1 b 50 150 2000 175 500 1000 150 176 2050
重塑数据让你有单独的列vol
,price
,min
和max
。接下来,仅过滤price
介于min
和之间的行max
,按sym
列分组并将结果附加到df
。
df["vol_sum"] = (pd.wide_to_long(df,
stubnames=["vol", "price"],
i=["sym", "min", "max"],
j="number",
sep="_")
.query("min <= price <= max", engine="python")
.groupby("sym")
.vol
.sum()
.array
)
sym vol_1 price_1 vol_2 price_2 vol_3 price_3 min max vol_sum
0 a 100 5 1500 20 123 22 18 23 1623
1 b 50 150 2000 175 500 1000 150 176 2050
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句