我要完成的目标是对列“mjtheme_namecode”中出现的任何数字的次数进行“计数”。我的导师说过我们必须使用 json_normalize 方法来完成这个任务。
通常我会使用 pd.value_counts() 但是单元格中有额外的文本所以这是不可能的。
格式如下:
我使用 pd.read_json 将数据读入 Pandas 数据帧,然后在 mjtheme_namecode 列上进行过滤。我尝试使用 json_normalize 访问数据,如下所示,但我继续收到错误消息:“字符串索引必须是整数”。
sample = df.to_json #Convert series to a json string
json_normalize(sample2, 'name')
谁能指出我如何可能解决这个问题?
谢谢!
对我来说工作:
import json
from pandas.io.json import json_normalize
with open('world_bank_projects.json') as data_file:
data = json.load(data_file)
df = json_normalize(data, 'mjtheme_namecode')
print (df.head())
code name
0 8 Human development
1 11
2 1 Economic management
3 6 Social protection and risk management
4 5 Trade and integration
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句