如何从另一个 python 字典中获取一个字典中的相应列表值,其中它们被列为键,比较并打印出一个 csv?

这很痛

我从大量数据中创建了一个默认字典,其中的值作为列表,如下所示。default_dictionary 值在默认字典中表示为列表。

default_dict = {('text2015', 'webnet'): [52384, 22276, 97376, 93696, 12672], ('datascience', 'bigdata', 'links'): [18720], ('biological', 'biomedics', 'datamining', 'datamodel', 'semantics'): [82465, 43424], ('links', 'scientometrics'): [23297, 73120]}

我有另一个 data_dictionary,它具有 default_dictionary 中的单个列表值作为键。data_dictionary 中的顺序是 (key_ID : [text_values], total, guser_ID)。数据字典具有以下形式:

data_dictionary = {52384: (['text2015', 'webnet'], 1444856137000, 335829830), 18720: (['datascience', 'bigdata', 'links'], 1444859841000, 17987803), 82465: (['biological', 'biomedics', 'datamining', 'datamodel', 'semantics'], 1444856, 335829830), 73120: (['links', 'scientometrics'], 144481000, 17987803), 22276: (['text2015', 'webnet'], 1674856137000, 615387550), 97376: (['text2015', 'webnet'], 1812856137000, 371559830), 43424: (['biological', 'biomedics', 'datamining', 'datamodel', 'semantics'], 5183856, 363549260), 23297: (['links', 'scientometrics'], 1614481000, 26253825)}

值列表中的第二个选项 (sum) 是我希望用来比较不同键的数字。它是一个总和。我希望总和最小的 key_ID 首先显示在 CSV 文件中,然后显示总和更大的 ID,依此类推,如下所示。一句话:

(key_ID( least sum ); key_ID ; sum for ( minimum sum ) key_ID ; sum for other key _Id ; 共享文本)

> 52384 ; 22276 ; 1444856137000 ; 1674856137000 ; ['text2015', 'webnet']
> 52384 ; 97376 ; 1444856137000 ; 1812856137000 ; ['text2015', 'webnet']
> 18720 ; 18720 ; 1444859841000 ; 1444859841000 ; ['datascience','bigdata', 'links']
> 82465 ; 43424 ; 1444856 ; 5183856 ;['biological', 'biomedics', 'datamining', 'datamodel', 'semantics']  
> 73120 ; 23297 ; 144481000 ; 1614481000 ; ['links', 'scientometrics']

到目前为止,我一直在尝试使用字典来构建值并使用 Pandas 将其打印为 csv,但并没有取得太大的成功。任何想法都会有所帮助。此代码为每个文本提供了共享该文本的 key_ID 的单独 csv 文件。

for key, value in default_dict.items():
    df = pd.DataFrame(value)
    df.to_csv('graph' + '_'.join(key) + '.csv', index=False)
吉姆·丹纳

下面的代码执行以下操作:

  1. 创建一个新字典,其中包含出现在您的两个字典中的那些记录,每个列表从最低到最高的“总和”排序(我已将其写在一个表达式中;为了便于阅读,您可以考虑将其分解为多个步骤)
  2. 翻阅新字典,看看最低和的项目是否必须有自己的行(当它是唯一的项目时)
  3. 浏览必须有自己行的项目,并按照上面的格式输出内容。

或者,您可以将其导入到 DataFrame 中,让 Pandas 处理另存为 CSV。我希望这有帮助。

output_dict = {textval: sorted(
                          [[key_ID, data_dictionary[key_ID][1]]
                          for key_ID in default_dict[textval]
                          if key_ID in data_dictionary],
                        key=lambda x: x[1])
               for textval in default_dict}

for textval, entries in output_dict.items():
    list_for_output = entries if len(entries) == 1 else entries[1:]
    for item in list_for_output:
        print('%d ; %d ; %d ; %d ; %s' % (entries[0][0], item[0],
        entries[0][1], item[1], list(textval)))

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

Related 相关文章

热门标签

归档