在Python(Pandas)或Pyspark中创建单词及其位置

编码器

嗨,我正在尝试创建一个字符串,该字符串将具有单词及其在输入字符串中出现的位置。我试过了-

def wordPositions(s):
    aDict = {}
    words = s.split(' ')
    for item in words:
        position = words.index(item)
        aDict[item] = position
    return aDict


s = 'Create a string with position from a string a' 

wp = wordPositions(s) 

print(wp)

它的输出是

{'Create': 0, 'a': 1 'string': 2, 'with': 3, 'position': 4, 'from': 5}

但我希望我的输出是

'Create': 1, 'a': 2,7,9 'string': 3,8 'with': 4, 'position': 5, 'from': 6

这里有三件事需要注意

  1. 索引t从1开始而不是0
  2. 删除字典的{},仅输入一个字符串
  3. 如果这个词在重复,那么我提到的所有位置都用逗号隔开

如何获得所需的输出。请帮忙

胡安

使用redefaultdict您可能会实现想要做的事情:

from collections import defaultdict
import re

s = 'Create a string with position from a string a' 
wp = defaultdict(list)

for n, k in enumerate(s.split()):
    wp[k].append(n+1)
    
raw_output = re.search('{(.*)}', str(wp)).group(1).replace('[','').replace(']','')
final_output = re.sub("(\d), '", r"\1 '", raw_output)

输出

"'Create': 1 'a': 2, 7, 9 'string': 3, 8 'with': 4 'position': 5 'from': 6"

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Python按句子创建单词列表并计算CSV文件中的均值和位置

来自分类Dev

单词中字母的python位置频率字典

来自分类Dev

在Python中将单词及其前10个单词的上下文提取到数据框中

来自分类Dev

在Python中创建找到的单词数组

来自分类Dev

优化Pandas df以计算单词列表中的位置字符频率

来自分类Dev

在Python中动态创建类及其构造函数

来自分类Dev

python在pandas df中替换整个单词

来自分类Dev

JavaScript:获取句子中的单词及其索引

来自分类Dev

从文件中过滤出单词及其值

来自分类Dev

在python中的位置或持续时间旁边提取单词

来自分类Dev

排除在python中创建新间隔的位置

来自分类Dev

如何在 Python 中的字符串中获取多个相同的字符及其位置?

来自分类Dev

位置参数中的单词拆分

来自分类Dev

在列表中查找单词的位置

来自分类Dev

查找单词在文本中的位置

来自分类Dev

如何在Python中创建“单词流”和“文档流”?

来自分类Dev

在 Python 中为提取的单词创建表格是/否表

来自分类Dev

在 Python 中创建字典并使用它来翻译单词

来自分类Dev

从开始单词python创建新单词

来自分类Dev

如何用Pandas,Python中的几个指定单词替换系列中的所有单词?

来自分类Dev

如何创建类似Jugnoo的位置UI。Mapview及其以下是viewpager?

来自分类Dev

从 python pandas 中的数据框中计算不同的单词

来自分类Dev

搜索并替换目录及其子目录中的单词

来自分类Dev

python从单个列表理解中创建一个set / dict / list及其值的总和

来自分类Dev

单列矩阵及其转置以在python,numpy scipy中创建对称矩阵

来自分类Dev

如何计算pyspark中每行的单词数

来自分类Dev

过滤PySpark中的特定单词

来自分类Dev

如何在Pandas Python中创建DataFrame

来自分类Dev

在用户列Python Pandas中的“成本中心”列及其用户对数据框进行排序

Related 相关文章

  1. 1

    Python按句子创建单词列表并计算CSV文件中的均值和位置

  2. 2

    单词中字母的python位置频率字典

  3. 3

    在Python中将单词及其前10个单词的上下文提取到数据框中

  4. 4

    在Python中创建找到的单词数组

  5. 5

    优化Pandas df以计算单词列表中的位置字符频率

  6. 6

    在Python中动态创建类及其构造函数

  7. 7

    python在pandas df中替换整个单词

  8. 8

    JavaScript:获取句子中的单词及其索引

  9. 9

    从文件中过滤出单词及其值

  10. 10

    在python中的位置或持续时间旁边提取单词

  11. 11

    排除在python中创建新间隔的位置

  12. 12

    如何在 Python 中的字符串中获取多个相同的字符及其位置?

  13. 13

    位置参数中的单词拆分

  14. 14

    在列表中查找单词的位置

  15. 15

    查找单词在文本中的位置

  16. 16

    如何在Python中创建“单词流”和“文档流”?

  17. 17

    在 Python 中为提取的单词创建表格是/否表

  18. 18

    在 Python 中创建字典并使用它来翻译单词

  19. 19

    从开始单词python创建新单词

  20. 20

    如何用Pandas,Python中的几个指定单词替换系列中的所有单词?

  21. 21

    如何创建类似Jugnoo的位置UI。Mapview及其以下是viewpager?

  22. 22

    从 python pandas 中的数据框中计算不同的单词

  23. 23

    搜索并替换目录及其子目录中的单词

  24. 24

    python从单个列表理解中创建一个set / dict / list及其值的总和

  25. 25

    单列矩阵及其转置以在python,numpy scipy中创建对称矩阵

  26. 26

    如何计算pyspark中每行的单词数

  27. 27

    过滤PySpark中的特定单词

  28. 28

    如何在Pandas Python中创建DataFrame

  29. 29

    在用户列Python Pandas中的“成本中心”列及其用户对数据框进行排序

热门标签

归档