熊猫：使用正则表达式清理包含单引号和括号的字符串列？

debugcn 发表于 Dev

山塔努

我想清除下面的Pandas数据框列，但是要用一个有效的语句，而不是我在下面的代码中尝试实现的方法。

输入：

                  string
0  ['string', '#string']
1            ['#string']
2                     []

输出：

            string
0  string, #string
1          #string
2              NaN

码：

import pandas as pd
import numpy as np

d = {"string": ["['string', '#string']", "['#string']", "[]"]}
df = pd.DataFrame(d)

df['string'] = df['string'].astype(str).str.strip('[]')
df['string'] = df['string'].replace("\'", "", regex=True)
df['string'] = df['string'].replace(r'^\s*$', np.nan, regex=True)

print(df)

维克多·史翠比维

您可以使用

df['string'] = df['string'].astype(str).str.replace(r"^[][\s]*$|(^\[+|\]+$|')", lambda m: '' if m.group(1) else np.nan)

详细资料：

^[][\s]*$-一个字符串，仅由零个或多个匹配[，]或空格字符
| - 要么
(^\[+|\]+$|')-[在字符串开始处捕获一个或多个字符，或者]在字符串末尾捕获一个或多个字符或任何字符，将其分组为第1组'。

如果组1匹配，则替换为空字符串（匹配项已删除），否则，替换为np.nan。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-8

我来说两句

0条评论

登录后参与评论

来自分类Dev

如何使用正则表达式匹配单引号或双引号中的字符串

来自分类Dev

Ruby正则表达式提取单引号/双引号之间的字符串，其中可能包含转义字符

来自分类Dev

带有转义单引号的单引号字符串上的Python正则表达式

来自分类Dev

PHP 正则表达式提取带引号和括号的子字符串

来自分类Dev

用于拆分字符串的正则表达式，使用空格，除非在引号和括号内

来自分类Dev

熊猫-使用替换+正则表达式从字符串列中提取数值

来自分类Dev

正则表达式提取单引号或双引号之外的字符串

来自分类Dev

Python正则表达式将带引号的字符串与转义的单引号匹配

来自分类Dev

正则表达式提取单引号或双引号之外的字符串

来自分类Dev

java-正则表达式使用空格分割字符串，但不考虑双引号或单引号

来自分类Dev

java-正则表达式使用空格分割字符串，但不考虑双引号或单引号

来自分类Dev

正则表达式：按逗号分割，但括号和引号中不包括逗号（单引号和双引号）

来自分类Dev

PHP-正则表达式，用于删除字符串开头和结尾的单引号

来自分类Dev

如何使用正则表达式从引号之间提取包含所需字符串的组？

来自分类Dev

正则表达式以添加逗号和单引号

来自分类Dev

使用正则表达式和清理字符串内存？

来自分类Dev

正则表达式混淆使用双引号和单引号

来自分类Dev

使用正则表达式从链接中提取单引号和双引号 url

来自分类Dev

使用正则表达式从字符串列中删除小数和非数字

来自分类Dev

正则表达式，某些字符串后的单引号之间的匹配

来自分类Dev

尝试使用反斜杠和引号对字符串进行正则表达式

来自分类Dev

如何使用引号和正则表达式 grep aa 字符串？

来自分类Dev

检查字符串是否仅包含字母空格和引号（最好不包含正则表达式）

来自分类Dev

在Java中使用正则表达式-当两组外部括号包含嵌套的括号和字符串文字时，如何捕获它们？

来自分类Dev

正则表达式查找带引号的字符串中的所有大括号

来自分类Dev

正则表达式查找带引号的字符串中的所有大括号

来自分类Dev

使用正则表达式匹配包含数字和特殊字符的字符串

来自分类Dev

正则表达式检索带引号的字符串和引号字符

来自分类Dev

使用正则表达式将包含浮点数的字符串清理为数字和十进制

Related 相关文章

文章