熊猫数据框中的向量化字符串操作

用户名

我有一个大的DataFrame,类似

import pandas as pd

sqldate = pd.Series(["2014-0-1", "2015-10-10", "1990-23-2"])
pdf = pd.Series(["2014.pdf", "2015.pdf", "1999.pdf"])

df = pd.DataFrame({"sqldate":sqldate, "pdf": pdf})

我想创建一个布尔列,以指示sqldate的年份是否与pdf名称的年份相同。

forloop很容易做到的另一种情况,但我想对其进行矢量化以提高速度/清洁度。但是我不知道怎么做。

我尝试了更简单的方法,甚至只是制作了df ['newcol']并尝试从日期中删除左边的四个字符。像df ['newcol'] = df ['sqldate'] [0:4],但是失败了。因为它将[0:4]解释为索引选择器,所以它仅使newcol = sqldate的前四行,其余的行成为Nan。

对于使用更优雅,矢量化的方法在数据帧上使用操纵的字符串值有何建议?

恋爱

您可以用来Series.str在列上使用字符串函数。因此df['sqldate'].str[0:4]将提取前四个字符(如果存在),然后检查以下两列(pdf和sqldate)的前四个字符是否相同,并将结果放入'newcol'中:

df['newcol'] = df['sqldate'].str[0:4]==df['pdf'].str[0:4]

查看有关字符串函数的更多信息:

http://pandas.pydata.org/pandas-docs/stable/text.html

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

熊猫中向量化字符串操作的时间安排

来自分类Dev

向量化条件字符串操作

来自分类Dev

熊猫数据框中的字符串列操作

来自分类Dev

替换熊猫数据框中的字符串

来自分类Dev

熊猫:数据框中的联合字符串

来自分类Dev

如何反转熊猫数据框中的字符串?

来自分类Dev

在熊猫数据框中搜索字符串

来自分类Dev

在熊猫数据框中创建可读的字符串

来自分类Dev

对熊猫数据框中的字符串求和

来自分类Dev

替换熊猫数据框中的字符串

来自分类Dev

在熊猫数据框中拆分字符串

来自分类Dev

熊猫if向量化操作中的语句

来自分类Dev

如何更新字符串的熊猫数据框列中的子字符串

来自分类Dev

熊猫:根据从旧数据框中的字符串中提取的数据创建新的数据框

来自分类Dev

将数据框中的字符串转换为向量并取消嵌套数据框

来自分类Dev

字符串匹配的向量化

来自分类Dev

删除数据框中任何向量中包含字符串的行

来自分类Dev

是否可以向量化熊猫数据框中从源到目标阵列的距离的计算?

来自分类Dev

通过在字符串中查找字符来对熊猫数据框进行切片

来自分类Dev

使用字典替换字符串,而不删除熊猫数据框中的字符

来自分类Dev

如何从熊猫数据框中的列中删除字符串值

来自分类常见问题

如何从熊猫数据框中删除包含特定列中特定字符串的行?

来自分类Dev

如何在熊猫数据框中执行字符串的左,右和中

来自分类Dev

去除?和 使用替换在熊猫数据框列中的字符串中的符号

来自分类Dev

如何使用单元格中的字符串重新输入熊猫中的数据框?

来自分类Dev

从熊猫数据框中的字符串中删除数字

来自分类Dev

拆分字符串并存储到熊猫数据框中的新列中

来自分类Dev

替换在熊猫的整个数据框中包含子字符串的整个字符串

来自分类Dev

向量化使用子字符串函数对不同长度的数据帧进行行选择

Related 相关文章

  1. 1

    熊猫中向量化字符串操作的时间安排

  2. 2

    向量化条件字符串操作

  3. 3

    熊猫数据框中的字符串列操作

  4. 4

    替换熊猫数据框中的字符串

  5. 5

    熊猫:数据框中的联合字符串

  6. 6

    如何反转熊猫数据框中的字符串?

  7. 7

    在熊猫数据框中搜索字符串

  8. 8

    在熊猫数据框中创建可读的字符串

  9. 9

    对熊猫数据框中的字符串求和

  10. 10

    替换熊猫数据框中的字符串

  11. 11

    在熊猫数据框中拆分字符串

  12. 12

    熊猫if向量化操作中的语句

  13. 13

    如何更新字符串的熊猫数据框列中的子字符串

  14. 14

    熊猫:根据从旧数据框中的字符串中提取的数据创建新的数据框

  15. 15

    将数据框中的字符串转换为向量并取消嵌套数据框

  16. 16

    字符串匹配的向量化

  17. 17

    删除数据框中任何向量中包含字符串的行

  18. 18

    是否可以向量化熊猫数据框中从源到目标阵列的距离的计算?

  19. 19

    通过在字符串中查找字符来对熊猫数据框进行切片

  20. 20

    使用字典替换字符串,而不删除熊猫数据框中的字符

  21. 21

    如何从熊猫数据框中的列中删除字符串值

  22. 22

    如何从熊猫数据框中删除包含特定列中特定字符串的行?

  23. 23

    如何在熊猫数据框中执行字符串的左,右和中

  24. 24

    去除?和 使用替换在熊猫数据框列中的字符串中的符号

  25. 25

    如何使用单元格中的字符串重新输入熊猫中的数据框?

  26. 26

    从熊猫数据框中的字符串中删除数字

  27. 27

    拆分字符串并存储到熊猫数据框中的新列中

  28. 28

    替换在熊猫的整个数据框中包含子字符串的整个字符串

  29. 29

    向量化使用子字符串函数对不同长度的数据帧进行行选择

热门标签

归档