搜索

搜索

如何在熊猫中多次提取字符串中存在的单个模式

debugcn 发表于 Dev

6

西姆兰·古拉蒂

我有以下数据

Description
4 GB+ 2 GB Night 3G/2G Data
Unlimited Local & STD Calls + 500 MB 3G/2G Data (T&C apply)
9GB + 8GB night data+ 6GB next night data
8 GB data 4G

我想要的是提取数据量（4GB 等）并将它们合并到一个列中

df2=df['Description'].str.extract('([0-9]+(\.[0-9][0-9]?)?\s?GB|[0-9]+(\.[0-9][0-9]?)?\s?MB)')

我用熊猫的功能extractall()太多，但两者extract并extractall()给我造成这样的

0     1    2
4GB   Nan  Nan     #2 gb is missing
500MB Nan  Nan   
9GB   Nan  Nan     # 8gb 6 gb is missing
8Gb   Nan  Nan

我错在哪里？此外，当将行与df.fillna(' ')我组合时，我会得到这样的输出

     0 
    4GB,2GB, 
    500MB, , 
    9GB,8GB,6GB
    8GB, ,

虽然我想要的是

0
4GB,2GB
500MB
9GB,8GB,6GB
8GB

我不想要空格。在 Pandas 中有什么方法可以获取上述格式的数据吗？我是python的初学者，不知道如何实现。如果有其他方法请提及。

编辑：

这是完整的代码：

df2=df['Description'].str.extractall('([0-9]+(\.[0-9][0-9]?)?\s?GB|[0-     9]+(\.[0-9][0-9]?)?\s?MB)')
#print df2
df2[1].fillna("",inplace=True);
df2[2].fillna("",inplace=True)
print df2
df3=df2[0]+','+df2[1]+','+df2[2];
print df3

艾伦

使用extractall 应该像下面这样工作：

df.Description.str\
  .extractall('(\d*\s?[GM]B)').groupby(level=0)\
  .apply(lambda x: ','.join(x[0])\
  .replace(' ',''))
Out[75]: 
0        4GB,2GB
1          500MB
2    9GB,8GB,6GB
3            8GB
dtype: object

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-12

0

我来说两句

0条评论

登录后参与评论

相关文章

来自分类Dev

根据bash脚本中的模式提取字符串

来自分类Dev

如何从bash中的两个模式之间提取字符串

来自分类Dev

如何从bash中的两个模式之间提取字符串

来自分类Dev

如何在EXCEL中可变数量的字符后提取字符串？

来自分类Dev

如何提取字符串中的数据？

来自分类Dev

如何从PHP中的文件中提取字符串

来自分类Dev

如何在Go中从interface {}变量中提取字符串？

来自分类Dev

如何在ruby中提取字符串中单词的首字母而不循环？

来自分类Dev

如何在Android Studio中启用“提取字符串资源”弹出窗口？

来自分类Dev

如何在Swift中从观察对象中提取字符串值

来自分类Dev

如何在python中以字符串类型提取字节数据？

来自分类Dev

如何在xslt中的方括号内提取字符串

来自分类Dev

如何在php中的逗号前提取字符串

来自分类Dev

如何在文件中的两个\ n之间提取字符串

来自分类Dev

如何在Android中从数组中提取字符串？

来自分类Dev

如何在Stata中仅提取字符串的大写部分？

来自分类Dev

如何在Android Studio中从数组中大量提取字符串资源？

来自分类Dev

如何在 Swift 3 中从 URL 中提取字符串？

来自分类Dev

如何在分隔符前后提取字符串并存储在mysql中？

来自分类Dev

如何在量角器中从 JSON 对象中提取字符串

来自分类Dev

如何在字符串中的数字之前提取单个字符

来自分类Dev

如何在python中的多行字符串中的两个子字符串之间提取字符串的一部分

来自分类Dev

如何从数据框中的列中提取字符串模式，并创建一个包含提取的字符串的新数据框列？

来自分类Dev

如何在熊猫数据框列中提取字符串的各个部分

来自分类Dev

提取字符串中R中由特定模式包围的所有数字

来自分类Dev

如何从C＃中的字符串中提取字符串

来自分类Dev

如何从Java中的字符串中分别提取字符串和整数？

来自分类Dev

如何从Java中的字符串中分别提取字符串和整数？

来自分类Dev

如何在Java中的<>之间获取字符串

Related 相关文章

文章

热门标签

归档