我有一个来自BLS的数据的DataFrame,它具有与series_id,year,period和value对应的列。每个条目的series_id的长度为20个字符,最后两个字符对应于度量的类型(即01:所有员工,以千计,26:所有员工,平均3个月变化)。无论如何,是否将DataFrame分为多个列(所有员工,所有员工,三个月的平均变动等)?我总共希望分割9个小节,并且没有切换到其他小节的频率的模式,因此我无法每100个条目或任何数量分割DataFrame。
数据的网址为:https : //download.bls.gov/pub/time.series/sm/sm.data.0.Current
数据如下所示:
我希望数据看起来像什么:
如果您仍在寻找解决方案。根据ansev的建议使用数据透视表:
df['measure']=df['series_id'].str[18:20]
df['series_id']=df['series_id'].str[:18]
dat=df.pivot_table(index=['series_id','year','period'],values='value',
columns=['measure']).reset_index()
# To rename columns
names={'01':'All Employees','26':'All Employees, 3-month change'}
dat=dat.rename(columns=names)
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句