使用Pandas DataFrame处理数据集时遇到了一些问题。
这是我的数据集:
我的数据类型显示在下面:
我的数据集来自:
MY_DATASET = pd.read_excel(EXCEL_FILE_PATH,index_col =无,na_values = ['NA'],usecols =“ A,D”)
我想对“日期”列中每个月的“人数”列中的所有值求和。例如,只要“日期”(DATE)列中的值是“ 2020-01”,“ 2020-02”,就会添加“人数”列中的所有值。
但是,由于不确定,所以我陷入了困境如何在部分匹配时使用.groupby。
1)完成之后,我还尝试将“ DATE”列中的值从YYYY-MM-DD转换为YYYY-MMM,例如2020年1月。
但是,我不确定是否有这种格式。
有谁知道如何解决这些问题?
非常感谢!
检查一下
s = df['NUMBER OF PEOPLE'].groupby(pd.to_datetime(df['DATE'])).dt.strftime('%Y-%b')).sum()
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句