如何基于其他行上的条件创建列-Pandas Dataframe？

debugcn 发表于 Dev

宝宝

我有以下问题：

名为df1的数据框如下所示：

    Id      PVF PM_year Year
0   A6489   75  25      2018
1   A175    56  54      2018
2   A2856   34  65      2018
3   A6489   35  150     2019
4   A175    45  700     2019
5   A2856   55  120     2019
6   A6489   205 100     2020
7   A2856   35  445     2020

我想创建一个名为PM_previous_year的新列，该列对于每个组合（ID + Year）等于相同ID和上一年的PM_year的值...

范例：

对于索引为3的行，Id为'A6489'，年份为2019。因此，新列“ PM_previous_year”的值应为ID相同（'A6489'）并且year等于的行的值2018（2019-1）。在这个简单的示例中，它对应于索引为0的行，索引为3的行中新列的期望值为25。

最后，此简短示例的目标DataFrame df2如下所示：

    Id     PVF  PM_year Year    PM_previous_year
0   A6489   75  25      2018    NaN
1   A175    56  54      2018    NaN
2   A2856   34  65      2018    NaN
3   A6489   35  150     2019    25.0
4   A175    45  700     2019    54.0
5   A2856   55  120     2019    65.0
6   A6489   205 100     2020    150.0
7   A2856   35  445     2020    120.0

我还没有找到任何明显的解决方案。也许有一种方法可以重塑df，但我对此并不十分熟悉。如果有人有任何想法，我将不胜感激。谢谢

耶斯列尔

如果可能，简化解决方案和PM_year每次Id使用的转移：

df['PM_previous_year'] = df.groupby('Id')['PM_year'].shift()
print (df)
      Id  PVF  PM_year  Year  PM_previous_year
0  A6489   75       25  2018               NaN
1   A175   56       54  2018               NaN
2  A2856   34       65  2018               NaN
3  A6489   35      150  2019              25.0
4   A175   45      700  2019              54.0
5  A2856   55      120  2019              65.0
6  A6489  205      100  2020             150.0
7  A2856   35      445  2020             120.0

要么：

s = df.pivot('Year','Id','PM_year').shift().unstack().rename('PM_previous_year')

df = df.join(s, on=['Id','Year'])
print (df)
      Id  PVF  PM_year  Year  PM_previous_year
0  A6489   75       25  2018               NaN
1   A175   56       54  2018               NaN
2  A2856   34       65  2018               NaN
3  A6489   35      150  2019              25.0
4   A175   45      700  2019              54.0
5  A2856   55      120  2019              65.0
6  A6489  205      100  2020             150.0
7  A2856   35      445  2020             120.0

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。