遍历pandas数据框并将新值插入空列

dataelephant 发表于 Dev

数据象素

我是Pandas的新手，在遍历数据集中给定列中的值并查找包含特定字符串的单元格时遇到了麻烦。

Address,City
['1234 Apple Drive', 'San Francisco', 'CA'],''
['4678 Bannana Street', 'Austin', 'TX'],''

对于此示例，我想a）仅提取b）包含字符串“ Street”的地址的街道信息，以及c）将其放置在新插入的名为“ Street”的列中。

Address,City,Street
['1234 Apple Drive', 'San Francisco', 'CA'],'',''
['4678 Bannana Street', 'Austin', 'TX'],'','4678 Bannana Street'

我知道如何在数据集中插入新列。到目前为止，我的代码看起来像这样（假设我当前的数据集只有两列，并且来自示例中的条目）：

import numpy as np
import pandas as pd
from pandas import DataFrame, read_csv

df = pd.read_csv('dataset.csv', sep = '\t')
df.insert(loc=3, column = 'street', value=str)

我剩下的一切都不漂亮，到目前为止一直没有用。非常感谢执行a，b和c的任何帮助！谢谢。

海盗

试试这个：

import re

df = pd.DataFrame([['1234 Apple Drive', 'San Francisco', 'CA'],
                   ['4678 Bannana Street', 'Austin', 'TX']],
                  columns=['Address', 'City', 'State'])

df['Street'] = df.Address.str.extract(r'([\S]+)\s+Street', flags=re.IGNORECASE)
print df

               Address           City State   Street
0     1234 Apple Drive  San Francisco    CA      NaN
1  4678 Bannana Street         Austin    TX  Bannana

如果您还想添加街道号码，请执行以下操作：

import re

df[['Street Number', 'Street']] = df.Address.str.extract(r'(\S+)\s+(\S+)\s+Street', expand=True, flags=re.IGNORECASE)
print df

               Address           City State Street Number   Street
0     1234 Apple Drive  San Francisco    CA           NaN      NaN
1  4678 Bannana Street         Austin    TX          4678  Bannana

笔记

如果未指定该expand标志，则使用pandas 0.18.1会收到将来的警告。改用它。

df['Street'] = df.Address.str.extract(r'([\S]+)\s+Street', expand=False, flags=re.IGNORECASE)

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-03-3

我来说两句

0条评论

登录后参与评论

来自分类Dev

遍历 pandas 数据框，使用 if 语句检查每个列值并将列值传递给空 df 的首选列

来自分类Dev

遍历pandas数据框列并使用if语句评估eval并将列值传递到空列表/字典

来自分类Dev

如何在遍历熊猫数据框时创建新列和插入行值

来自分类Dev

遍历 pandas 数据框中的行并匹配列表字典中的值以创建新列

来自分类Dev

创建一个函数以遍历现有数据框并将值添加到新列

来自分类Dev

遍历熊猫数据框并创建新的列值

来自分类Dev

遍历Pandas数据框的列并创建新变量

来自分类Dev

添加一个新列 IsActive 并将其数据类型设置为 bit 并希望将其设置为非空。无法在 IsActive 列中插入空值

来自分类Dev

如何遍历数据框中的列值，取均值并创建新的数据框？

来自分类Dev

根据pandas数据框中的列值插入行

来自分类Dev

从数据框中提取不同的值，并将它们插入具有相同列名称的新数据框中

来自分类Dev

如何解析pandas数据框中的JSON列，并将新数据框连接到原始数据框中？

来自分类Dev

在数据框中查找字符串并将新值存储在新列中

来自分类Dev

如何在Pandas中将字典的值插入数据框的空值中？

来自分类Dev

循环遍历数据框的每一列应用函数并将结果保存为新列

来自分类Dev

遍历pandas数据框中的两列

来自分类Dev

创建多个空列并将其分配给pandas数据框中的0

来自分类Dev

遍历唯一的列值以创建数据框，在子数据框上运行函数并将其保存为单个concat

来自分类Dev

向空数据框插入或添加新列不起作用

来自分类Dev

基于值pandas数据框插入行

来自分类Dev

遍历数据框以添加具有顺序值的新列

来自分类Dev

遍历数据框以添加具有顺序值的新列

来自分类Dev

向数据框添加新列会插入一个NaN值，而不是所需的值

来自分类Dev

如何拆分数据框中的列并将每个值存储为新行（在熊猫中）？

来自分类Dev

如何重新计算列并将新值存储在同一数据框中？

来自分类Dev

遍历数据框并将其循环到新数据框

来自分类Dev

如何在从文本框中插入数据之前检查列值是否为空

来自分类Dev

在 Pandas 数据框中插入 numpy 列

来自分类Dev

Pandas数据框：根据另一列中的值操纵列（无需遍历行）

Related 相关文章

文章