使用正则表达式(python)删除unicode项目符号-找不到项目符号

安东尼·钟

我在论坛上进行了一些搜索,试图用似乎适用的所有解决方案删除项目符号。

“弗里蒙特·全日制”

关于如何分割字符串以仅提取“ Fremont”的任何想法吗?

我目前有删除子弹的方法,但是出现以下两个错误:

string.replace('/\d\.\s+|[a-z]\)\s+|[A-Z]\.\s+|[IVX]+\.\s+/g', "")

这根本不影响更改字符串,这告诉我正则表达式查询无法识别细小项目符号

string.replace('/\d\.\s+|[a-z]\)\s+|•\s+|[A-Z]\.\s+|[IVX]+\.\s+/g', "")

这给出了以下错误:

UnicodeDecodeError:'ascii'编解码器无法解码位置20的字节0xe2:序数不在范围内(128)

也尝试过这种方式

bullet = u"\u2022"
string =u"Fremont · Full Time"
string2 = string.replace(bullet, "A")
newStr = re.sub(regex, "", string)

没有效果

有任何想法吗?

saq7

这会做到的

import string
string_to_replace = "Fremont · Full Time"
regex = '\xc2\xb7'
string.replace(string_to_replace, regex, '')

我是怎么发现的

>>> a = "Fremont · Full Time"
>>> a.split()
['Fremont', '\xc2\xb7', 'Full', 'Time']
>>> import string
>>> string.replace(a,'\xc2\xb7',"")
'Fremont  Full Time'

[编辑]
正如Joey正确指出的那样,这取决于系统的编码。split功能应该有助于弄清楚项目符号是如何在您的系统中编码的,以及希望代码在其上运行的系统。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用正则表达式(python)删除unicode项目符号-找不到项目符号

来自分类Dev

用正则表达式提取项目符号编号

来自分类Dev

Python正则表达式,删除除Unicode字符串的连字符以外的所有标点符号

来自分类Dev

在Java正则表达式中处理Unicode符号

来自分类Dev

正则表达式 - 不能删除 @ 符号

来自分类Dev

用正则表达式删除标点符号-python

来自分类Dev

Python上的正则表达式,用于按符号分割字符串而不删除

来自分类Dev

Python正则表达式删除<>符号之间的所有文本

来自分类Dev

如何使用正则表达式删除字符之间的符号

来自分类Dev

如何使用正则表达式删除字符串中的标点符号

来自分类Dev

如何使用正则表达式删除(替换)标点符号?

来自分类Dev

使用正则表达式删除emacs中的特殊符号

来自分类Dev

使用正则表达式删除单个标点符号

来自分类Dev

Spring Boot多模块Gradle项目类路径问题:找不到包,找不到符号

来自分类Dev

正则表达式匹配标题和子标题,后跟项目符号列表

来自分类Dev

如何在正则表达式的嵌套项目符号列表中搜索单词的组合?

来自分类Dev

正则表达式标点符号拆分[Python]

来自分类Dev

python正则表达式度数符号

来自分类Dev

使用点符号的意外正则表达式结果

来自分类Dev

使用符号'搜索正则表达式

来自分类Dev

使用转义符号获取正则表达式的出现

来自分类Dev

正则表达式以匹配符号&-。'

来自分类Dev

正则表达式以@符号开头

来自分类Dev

正则表达式与欧元符号

来自分类Dev

正则表达式匹配@符号

来自分类Dev

找不到CGRectMake符号

来自分类Dev

找不到符号assertEquals

来自分类Dev

找不到符号“组件”

来自分类Dev

ANTLR:找不到符号

Related 相关文章

热门标签

归档