如何在 Python 中将一组字符串拆分为子字符串,使更短的子字符串更有可能?

麦克蜘蛛

我有一组字符串,每个字符串都有数百万个字符。我想将它们拆分为随机长度的子字符串,我可以毫无问题地做到这一点。

但是,我的问题是:如何对子串长度选择应用某种权重?我的代码在 中运行python3,所以我想找到一个 pythonic 解决方案。详细来说,我的目标是:

  • 将字符串拆分为长度范围在 1*e04 和 8*e06 字符之间的子字符串。
  • 这样做,脚本会更频繁地为新生成的子字符串选择短长度 (1*e04) 而非长长度 (8*e06),例如长度降序的似然梯度。

谢谢您的帮助!

马库斯柯斯努斯

可能有很多方法可以做到这一点。我会这样做:

  1. rand在区间取一个随机数[0,1]
    import random
    rand = random.random()
  2. 对该数字使用运算使较小的数字更有可能,但保持在[0,1]. 您使用的操作取决于您希望似然分布的样子。一个简单的选择是正方形。
    rand = rand**2
  3. 将数字空间[0,1]向上缩放[1e04, 8e06]并四舍五入到下一个整数:
    subStringLen = round(rand*(8e06-1e04)+1e04)
  4. 从字符串中获取长度的子subStringLen字符串并检查还剩多少个字符。
    • 如果8e06剩余的字符多于第 1 步。
    • 如果在1e04之间8e06,请将它们用作最后​​一个子字符串。
    • 如果少于1e04您需要决定是否要丢弃其余部分或允许小1e04于此特殊情况下的子字符串

我相信在效率方面有很多可能的改进,这只是为了让您了解我的方法。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何在 Python 中将字符串拆分为列表?

来自分类Dev

如何在Python中将没有空格的字符串拆分为整数列表?

来自分类Dev

如何在Python中将字符串拆分为单词和特殊字符?

来自分类Dev

如何在python中将字符串拆分为每个部分仅包含相同字符的部分

来自分类Dev

如何在Python中获取字符串的所有连续子字符串?

来自分类Dev

如何在python字符串中的子字符串之间查找子字符串?

来自分类Dev

如何在python中将字符串拆分为多个部分?

来自分类Dev

如何在python中将字节字符串拆分为单独的字节

来自分类Dev

如何在python中将文本文件的字符串拆分为char和number

来自分类Dev

如何在Python中将列表拆分为不同的字符串

来自分类Dev

Python:如何将一组包含逗号(表示为列表元素)的字符串转换为子列表?

来自分类Dev

如何在python 3中将一组随机字母放入对齐的字符串中?

来自分类Dev

在Python中找到字符串中的所有子字符串,如何使它更好?

来自分类Dev

如何在python 3中计算字符串中的连续子字符串

来自分类Dev

如何在Python字符串中查找子字符串

来自分类Dev

如何在python中将字符串切成一对字符串

来自分类Dev

如何在Python文件中计算一组字符串?

来自分类Dev

如何使用python将字符串拆分为dict?

来自分类Dev

如何在Python的字符串列表中的特定字符后删除子字符串

来自分类Dev

如何在python的示例字符串中找到所有长度为k的重叠子字符串

来自分类Dev

如何在字符串中找到一个以上的子字符串的位置(Python 3.4.3 shell)

来自分类Dev

如何在Excel文件中搜索一组输入字符串并使用Python返回所有匹配的行?

来自分类Dev

Python 3:如何将字符串拆分为一系列字符?

来自分类Dev

如何在字符串中找到子字符串并到达字符模式时结束子字符串(Python)

来自分类Dev

如何在Python的嵌套列表中拆分字符串?

来自分类Dev

如何在Python中拆分此字符串?

来自分类Dev

如何在Python中使用递归拆分字符串?

来自分类Dev

如何在Python的嵌套列表中拆分字符串?

来自分类Dev

我如何在python中拆分此字符串

Related 相关文章

  1. 1

    如何在 Python 中将字符串拆分为列表?

  2. 2

    如何在Python中将没有空格的字符串拆分为整数列表?

  3. 3

    如何在Python中将字符串拆分为单词和特殊字符?

  4. 4

    如何在python中将字符串拆分为每个部分仅包含相同字符的部分

  5. 5

    如何在Python中获取字符串的所有连续子字符串?

  6. 6

    如何在python字符串中的子字符串之间查找子字符串?

  7. 7

    如何在python中将字符串拆分为多个部分?

  8. 8

    如何在python中将字节字符串拆分为单独的字节

  9. 9

    如何在python中将文本文件的字符串拆分为char和number

  10. 10

    如何在Python中将列表拆分为不同的字符串

  11. 11

    Python:如何将一组包含逗号(表示为列表元素)的字符串转换为子列表?

  12. 12

    如何在python 3中将一组随机字母放入对齐的字符串中?

  13. 13

    在Python中找到字符串中的所有子字符串,如何使它更好?

  14. 14

    如何在python 3中计算字符串中的连续子字符串

  15. 15

    如何在Python字符串中查找子字符串

  16. 16

    如何在python中将字符串切成一对字符串

  17. 17

    如何在Python文件中计算一组字符串?

  18. 18

    如何使用python将字符串拆分为dict?

  19. 19

    如何在Python的字符串列表中的特定字符后删除子字符串

  20. 20

    如何在python的示例字符串中找到所有长度为k的重叠子字符串

  21. 21

    如何在字符串中找到一个以上的子字符串的位置(Python 3.4.3 shell)

  22. 22

    如何在Excel文件中搜索一组输入字符串并使用Python返回所有匹配的行?

  23. 23

    Python 3:如何将字符串拆分为一系列字符?

  24. 24

    如何在字符串中找到子字符串并到达字符模式时结束子字符串(Python)

  25. 25

    如何在Python的嵌套列表中拆分字符串?

  26. 26

    如何在Python中拆分此字符串?

  27. 27

    如何在Python中使用递归拆分字符串?

  28. 28

    如何在Python的嵌套列表中拆分字符串?

  29. 29

    我如何在python中拆分此字符串

热门标签

归档