我正在使用一个 Pandas DataFrame,它在数组中有一列条目,例如以下示例:
user_id tags
0 1 [a,b,c]
1 2 [a,b,d]
2 3 [b,c]
...
n n [a,d]
我有一些与 JSON 对象中的简化标签相关的标签 ID,我正在尝试使用以下方法用它们的非简化变体替换条目:
for user_tags in dataset['tags']:
for tag in user_tags:
for full_tag in UUIDtags['tags_full']:
if full_tag['id'] == tag:
tag = entry['name']
id
和name
是 JSON 对象中对应的简化标签和完整标签名称。
但是,这不会在执行时更改值;是否有我缺少的 Pandas 方法来替换这些值?恐怕我会替换整个数组而不是替换单个条目。
谢谢!
编辑:JSON 对象 ( UUIDtags
) 包含的示例。
{
"tags_full": [{
"id": "a",
"name": "Alpha"
}, {
"id": "b",
"name": "Beta"
....
创建示例数据。
>>> df = pd.DataFrame({'tags':[list(['a', 'b', 'c']),
list(['a', 'b', 'd']), list(['b', 'c'])], 'user_id': [i for i in range(1,4)]})
>>> df
tags user_id
0 [a, b, c] 1
1 [a, b, d] 2
2 [b, c] 3
生成一个以字母为键、全标签为值的替换字典。
>>> replace_dict = {'a': 'Alpha', 'b': 'Beta', 'Charlie': 'c', 'Delta': 'd'}
好的,回到解决方案......使用中的相应值替换每行中的行和字母的迭代replacement_dict
。
>>> for row in range(len(df)):
... for tag in range(len(df.loc[row, 'tags'])):
... df.loc[row, 'tags'][tag] = replace_dict[df.loc[row, 'tags'][tag]]
...
这是结果。
>>> df
tags user_id
0 [Alpha, Beta, Charlie] 1
1 [Alpha, Beta, Delta] 2
2 [Beta, Charlie] 3
旁注: 的创建replacement_dict
是根据我的示例数据中出现的字母临时创建的替换字典。为了为您的完整数据生成这样的替换字典,您可以这样做。
例如,假设UUIDtags
是您的完整 JSON 对象
>>> UUIDtags = {'tags_full': [{'id':'a', 'name':'Alpha'}, {'id':'b', 'name':'Beta'}]}
我们可以像这样生成一个替换字典
>>> uuidtags_dict = {}
>>> for tag in UUIDtags['tags_full']:
... uuidtags_dict[tag['id']] = tag['name']
...
>>> uuidtags_dict
{'a': 'Alpha', 'b': 'Beta'}
这一代替换字典将根据您在编辑中提供的示例扩展到您的整个 JSON 对象。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句