熊猫数据框中的向量化字符串操作

user3556757 发表于 Dev

用户名

我有一个大的DataFrame，类似

import pandas as pd

sqldate = pd.Series(["2014-0-1", "2015-10-10", "1990-23-2"])
pdf = pd.Series(["2014.pdf", "2015.pdf", "1999.pdf"])

df = pd.DataFrame({"sqldate":sqldate, "pdf": pdf})

我想创建一个布尔列，以指示sqldate的年份是否与pdf名称的年份相同。

forloop很容易做到的另一种情况，但我想对其进行矢量化以提高速度/清洁度。但是我不知道怎么做。

我尝试了更简单的方法，甚至只是制作了df ['newcol']并尝试从日期中删除左边的四个字符。像df ['newcol'] = df ['sqldate'] [0：4]，但是失败了。因为它将[0：4]解释为索引选择器，所以它仅使newcol = sqldate的前四行，其余的行成为Nan。

对于使用更优雅，矢量化的方法在数据帧上使用操纵的字符串值有何建议？

恋爱

您可以用来Series.str在列上使用字符串函数。因此df['sqldate'].str[0:4]将提取前四个字符（如果存在），然后检查以下两列（pdf和sqldate）的前四个字符是否相同，并将结果放入'newcol'中：

df['newcol'] = df['sqldate'].str[0:4]==df['pdf'].str[0:4]

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-23

我来说两句

0条评论

登录后参与评论

上一篇：Android Studio Gradle androidTest与InstrumentTest

来自分类Dev

Related 相关文章

文章

熊猫数据框中的向量化字符串操作

熊猫数据框中的向量化字符串操作

熊猫中向量化字符串操作的时间安排

向量化条件字符串操作

熊猫数据框中的字符串列操作

替换熊猫数据框中的字符串

熊猫：数据框中的联合字符串

如何反转熊猫数据框中的字符串？

在熊猫数据框中搜索字符串

在熊猫数据框中创建可读的字符串

对熊猫数据框中的字符串求和

替换熊猫数据框中的字符串

在熊猫数据框中拆分字符串

熊猫if向量化操作中的语句

如何更新字符串的熊猫数据框列中的子字符串

熊猫：根据从旧数据框中的字符串中提取的数据创建新的数据框

将数据框中的字符串转换为向量并取消嵌套数据框

字符串匹配的向量化

删除数据框中任何向量中包含字符串的行

是否可以向量化熊猫数据框中从源到目标阵列的距离的计算？

通过在字符串中查找字符来对熊猫数据框进行切片

使用字典替换字符串，而不删除熊猫数据框中的字符

如何从熊猫数据框中的列中删除字符串值

如何从熊猫数据框中删除包含特定列中特定字符串的行？

如何在熊猫数据框中执行字符串的左，右和中

去除？和 使用替换在熊猫数据框列中的字符串中的符号

如何使用单元格中的字符串重新输入熊猫中的数据框？

从熊猫数据框中的字符串中删除数字

拆分字符串并存储到熊猫数据框中的新列中

替换在熊猫的整个数据框中包含子字符串的整个字符串

向量化使用子字符串函数对不同长度的数据帧进行行选择

去除？和使用替换在熊猫数据框列中的字符串中的符号