当groupie后跟value_counts()时如何计算pandas.Series范围

自动曝光

我有这样的数据:

year = ['2010', '2011-2014', '2013', '2012-2016', '2018-present', '2019', '2015-present', '2015']
products = ['A', 'B', 'C', 'D', 'B', 'E', 'F', 'A']
rating = [4, 2, 2, 3, 1, 1, 2, 2]

data = pd.DataFrame({'Products': products, 'Year': year, 'Rating': rating})

在我的分析中,我想将年份范围转换为单一年份的值(例如['2010', '2011', '2013', '2014', '2015', '2016', '2017', '2018', '2019', '2020']),并为其他列添加年份范围中的计数。例如,对于上述示例,我希望具有:{'2010':'A','2011':'B','2013':'B','2014':'B','2013':'c ','2012':'D','2013':'D','2014':'D','2015':'D','2016':'D',...}

我相信我需要的与pandas.cut装箱相反,但我不知道如何在大熊猫中进行

奕奕

您可以str.splitIIUC列中Year使用某些条件,然后使用列表理解:

df["Year"] = [list(range(int(i[0]), int(i[1] if i[1]!= "present" else "2020")+1))
              if len(i)>1 else list(range(int(i[0]), int(i[0])+1))
              for i in df["Year"].str.split("-")]

print (df.explode("Year"))

  Products  Year  Rating
0        A  2010       4
1        B  2011       2
1        B  2012       2
1        B  2013       2
1        B  2014       2
2        C  2013       2
3        D  2012       3
3        D  2013       3
3        D  2014       3
3        D  2015       3
3        D  2016       3
4        B  2018       1
4        B  2019       1
4        B  2020       1
5        E  2019       1
6        F  2015       2
6        F  2016       2
6        F  2017       2
6        F  2018       2
6        F  2019       2
6        F  2020       2
7        A  2015       2

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

熊猫,使用func pandas.Series.value_counts后如何获取索引?

来自分类Dev

类似于R中的Pandas Series.value_counts()?

来自分类Dev

pandas.Series.value_counts结果以频率为键的字典

来自分类Dev

使用generate_series()删除行范围?

来自分类Dev

遍历pandas数据框的所有列并计算每列中的值(pd.Series.value_counts(dropna = False))不起作用

来自分类Dev

如何分割数字范围并计算总范围?

来自分类Dev

当范围未知时,Pandas groupby值的范围

来自分类Dev

范围不连续时的Pandas Groupby范围

来自分类Dev

如何获得火花行的value_counts?

来自分类Dev

在熊猫中按另一列分组时如何返回value_counts()

来自分类Dev

如何在pandas数据框列中找到value_counts()的长度大于1的长度

来自分类Dev

如何根据value_counts()条件替换pandas dataframe列中的值?

来自分类Dev

如何以正确的顺序获取pandas中的value_counts()的返回值

来自分类Dev

如何计算IP地址范围?

来自分类Dev

xgboost保障范围如何计算?

来自分类Dev

如何使用R计算范围?

来自分类Dev

如何计算数组的范围?

来自分类Dev

将pandas.Series.value_counts返回的系列转换为字典

来自分类Dev

有关pandas value_counts函数的说明

来自分类Dev

在定义的条件下使用pandas value_counts()

来自分类Dev

使用 Pandas value_counts() 添加“休息”组

来自分类Dev

python/pandas - 按类别转换 value_counts

来自分类Dev

角重复范围计算

来自分类Dev

Java基元范围计算

来自分类Dev

计算广义范围的长度

来自分类Dev

动态范围计算宏

来自分类Dev

计算ListRelation范围的总和

来自分类Dev

计算范围之间的值

来自分类Dev

计算日期+时间范围

Related 相关文章

热门标签

归档