使用Numpy或Pandas对字符计数的字符串进行向量化拆分

mattyd2

有没有一种方法可以根据每个元素的字符数以向量化的方式分割Numpy Array?

输入:

In [1]: import numpy as np

In [2]: y = np.array([ 'USC00013160194806SNOW','USC00013160194806SNOW','USC00013160194806SNOW' ])

In [3]: y
Out[3]: 
array(['USC00013160194806SNOW', 'USC00013160194806SNOW',
       'USC00013160194806SNOW'], 
      dtype='|S21')

我希望根据一定数量的字符拆分数组的每个元素。

所需输出:

In [3]: y
Out[3]: 
array(['USC00013160', 'USC00013160',
       'USC00013160'], 
      dtype='|S21')

我已经使用标准的python循环执行了此操作,但是我正在处理数百万个值,因此我试图找出最快的方法。

mattyd2

我发现的一种可能的解决方案是仅使用Pandas Series完成操作,但是我想知道是否可以使用Numpy数组切片方法来完成如果不是,那很好,对最佳实践更好奇。

首发熊猫系列:

In [33]: x = pd.read_csv("data.txt", delimiter='\n', dtype=str, squeeze=True)
In [34]: x
Out[34]: 
0         USC00013160194807SNOW
1         USC00013160194808SNOW
2         USC00013160194809SNOW
3         USC00013160194810SNOW
4         USC00013160194811SNOW, dtype: object

基于字符计数的向量化字符串处理:

In [37]: k = x.str[0:11]

输出:

In [38]: k
Out[38]: 
0         USC00013160
1         USC00013160
2         USC00013160
3         USC00013160
4         USC00013160

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用pandas / numpy对左连接进行向量化

来自分类Dev

向量化使用子字符串函数对不同长度的数据帧进行行选择

来自分类Dev

在分隔符的帮助下对重复的字符串进行向量push_back

来自分类Dev

在分隔符的帮助下对重复的字符串进行向量push_back

来自分类Dev

向量化条件字符串操作

来自分类Dev

字符串匹配的向量化

来自分类Dev

JavaScript:对字符串中的单词进行拆分和计数

来自分类Dev

不使用拆分方法对不在字符串数组中的字符串中的单词进行计数

来自分类Dev

通过使用值计数拆分熊猫字符串比较

来自分类Dev

使用可变数组索引进行向量化

来自分类Dev

使用Python中的列表列表进行向量化

来自分类Dev

熊猫数据框中的向量化字符串操作

来自分类Dev

Python:将字符串向量化为Datetime循环

来自分类Dev

熊猫中向量化字符串操作的时间安排

来自分类Dev

在R中使用RegEx进行字符串拆分

来自分类Dev

使用struts2进行字符串拆分

来自分类Dev

使用字符串向量进行插入排序

来自分类Dev

如何使用if条件在1D和2D numpy数组之间进行向量化计算

来自分类Dev

使用dplyr对每行(行)中的特定字符串(字符串)进行计数或求和

来自分类Dev

使用包含相应字符的列将字符串向量拆分为数据帧

来自分类Dev

Octave中行向量的转置导致字符串转义符出现问题

来自分类Dev

Octave中行向量的转置会导致字符串转义符出现问题

来自分类Dev

如何对参数为numpy中的向量的函数进行向量化

来自分类Dev

如何对参数为numpy中的向量的函数进行向量化

来自分类Dev

如何使用分隔字符串“#|#”拆分字符串

来自分类Dev

使用未对齐的缓冲区进行向量化:使用VMASKMOVPS:从未对齐计数生成掩码?还是根本不使用那个insn

来自分类Dev

需要使用循环对函数进行向量化(用向量中的值替换NA行)

来自分类Dev

将字符串拆分为向量c ++

来自分类Dev

在C ++中将字节字符串拆分为BYTES的向量

Related 相关文章

  1. 1

    使用pandas / numpy对左连接进行向量化

  2. 2

    向量化使用子字符串函数对不同长度的数据帧进行行选择

  3. 3

    在分隔符的帮助下对重复的字符串进行向量push_back

  4. 4

    在分隔符的帮助下对重复的字符串进行向量push_back

  5. 5

    向量化条件字符串操作

  6. 6

    字符串匹配的向量化

  7. 7

    JavaScript:对字符串中的单词进行拆分和计数

  8. 8

    不使用拆分方法对不在字符串数组中的字符串中的单词进行计数

  9. 9

    通过使用值计数拆分熊猫字符串比较

  10. 10

    使用可变数组索引进行向量化

  11. 11

    使用Python中的列表列表进行向量化

  12. 12

    熊猫数据框中的向量化字符串操作

  13. 13

    Python:将字符串向量化为Datetime循环

  14. 14

    熊猫中向量化字符串操作的时间安排

  15. 15

    在R中使用RegEx进行字符串拆分

  16. 16

    使用struts2进行字符串拆分

  17. 17

    使用字符串向量进行插入排序

  18. 18

    如何使用if条件在1D和2D numpy数组之间进行向量化计算

  19. 19

    使用dplyr对每行(行)中的特定字符串(字符串)进行计数或求和

  20. 20

    使用包含相应字符的列将字符串向量拆分为数据帧

  21. 21

    Octave中行向量的转置导致字符串转义符出现问题

  22. 22

    Octave中行向量的转置会导致字符串转义符出现问题

  23. 23

    如何对参数为numpy中的向量的函数进行向量化

  24. 24

    如何对参数为numpy中的向量的函数进行向量化

  25. 25

    如何使用分隔字符串“#|#”拆分字符串

  26. 26

    使用未对齐的缓冲区进行向量化:使用VMASKMOVPS:从未对齐计数生成掩码?还是根本不使用那个insn

  27. 27

    需要使用循环对函数进行向量化(用向量中的值替换NA行)

  28. 28

    将字符串拆分为向量c ++

  29. 29

    在C ++中将字节字符串拆分为BYTES的向量

热门标签

归档