如何从数据框中的一列中提取信息并在右侧的列中插入

迪克森

我有一个制表符分隔的表,其前三行如下所示-一个标题行和前两个条目:

Geneid  Chr Start   End Strand  Length  Feature_count   contig_ID   MAG_id  RPKM
ID=G1_719_cleanedcontig_v2_1580_319;locus_tag=G1_719_cleanedcontig_v2_1580_319;contig_length=349332;orf_length=554;partial=00;sourcedb=None;annotvalue=0;ec=;product=hypothetical protein   G1_719_cleanedcontig_v2_1580    346495  347049  +   555 68733   NODE_28_length_349332_cov_12.741083 ag0r3_bin.39    11455.58033225708
ID=G1_719_cleanedcontig_v2_1582_130;locus_tag=G1_719_cleanedcontig_v2_1582_130;contig_length=189623;orf_length=3887;partial=00;sourcedb=None;annotvalue=0;ec=;product=hypothetical protein  G1_719_cleanedcontig_v2_1582    147164  151051  -   3888    61026   NODE_113_length_189623_cov_11.186889    ag0r3_bin.39    1451.8890393965803

我想为每一行提取“ ID”和第一个分号之间的信息(例如,对于第一行“ G1_719_cleanedcontig_v2_1582_130”),并将其放在右侧的列中。我该如何使用Bash或Python执行此操作或两者结合?

假设数据框为

                                             text
0  Geneid  Chr Start   End Strand  Length  Featur...
1  ID=G1_719_cleanedcontig_v2_1580_319;locus_tag=...
2  ID=G1_719_cleanedcontig_v2_1582_130;locus_tag=...

只需提取ID=AND之间的字符;

df['newcolumn']=df.text.str.extract('(?<=[ID]\=)(.*?)(?=\;)')




                                            text  \
0  Geneid  Chr Start   End Strand  Length  Featur...   
1  ID=G1_719_cleanedcontig_v2_1580_319;locus_tag=...   
2  ID=G1_719_cleanedcontig_v2_1582_130;locus_tag=...   

                          newcolumn  
0                               NaN  
1  G1_719_cleanedcontig_v2_1580_319  
2  G1_719_cleanedcontig_v2_1582_130  

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何从数据框列中提取信息以创建新的数据框

来自分类Dev

如何从数据框col中提取特定值并将其放在另一列中?

来自分类Dev

从多个CSV文件中提取信息,并在第三列中写入新的CSV文件

来自分类Dev

从多个CSV文件中提取信息,并在第三列中写入新的CSV文件

来自分类Dev

如何从数据框名称中提取信息并基于该名称创建列

来自分类Dev

从列中提取信息

来自分类Dev

如何计算数据框中的一列相对于另一列的统计信息?

来自分类Dev

从文本文件中提取一列并将其存储在Python中的数据框中

来自分类Dev

R:从数据框中提取行,其中一列中的值出现在单独的向量中

来自分类Dev

当另一列中该值仅存在多个数据时,如何从列中提取数据?

来自分类Dev

如何提取/拆分数据框中的列表列以分隔唯一列?

来自分类Dev

从R中的数据帧中提取信息

来自分类常见问题

从一列中提取数字并将其放在一个空列中,作为数据框熊猫中的int范围

来自分类Dev

从一列中提取数字并将其放在一个空列中,作为数据框熊猫中的int范围

来自分类Dev

如何从管理面板中的字段中提取信息?

来自分类Dev

使用任何可行的方法(PERL,SED,AWK)从文件行中提取信息到列中

来自分类Dev

从 jsonb 中的列表中提取信息

来自分类Dev

获取由R数据框中的另一列中的值分隔的一列的箱线图统计信息

来自分类Dev

如何总结数据框中的每一列?

来自分类Dev

根据两列中的信息向我的数据框添加一列

来自分类Dev

如何从数据框中的列中提取字符串模式,并创建一个包含提取的字符串的新数据框列?

来自分类Dev

如何检查数据框中的一列是否与另一数据框中的一列完全相等

来自分类Dev

根据另一参考表在数据框中的一列中插入值

来自分类Dev

如何从Wikipedia信息框中提取信息?

来自分类Dev

从不同文件追加数组,并在数据中插入一列

来自分类Dev

从不同文件追加数组,并在数据中插入一列

来自分类Dev

如何将一列中的值映射到数据框的另一列?

来自分类Dev

从数据框中的一列中以开头字母提取值

来自分类Dev

ListView详细信息在最后一列中插入数据Visual Basic

Related 相关文章

  1. 1

    如何从数据框列中提取信息以创建新的数据框

  2. 2

    如何从数据框col中提取特定值并将其放在另一列中?

  3. 3

    从多个CSV文件中提取信息,并在第三列中写入新的CSV文件

  4. 4

    从多个CSV文件中提取信息,并在第三列中写入新的CSV文件

  5. 5

    如何从数据框名称中提取信息并基于该名称创建列

  6. 6

    从列中提取信息

  7. 7

    如何计算数据框中的一列相对于另一列的统计信息?

  8. 8

    从文本文件中提取一列并将其存储在Python中的数据框中

  9. 9

    R:从数据框中提取行,其中一列中的值出现在单独的向量中

  10. 10

    当另一列中该值仅存在多个数据时,如何从列中提取数据?

  11. 11

    如何提取/拆分数据框中的列表列以分隔唯一列?

  12. 12

    从R中的数据帧中提取信息

  13. 13

    从一列中提取数字并将其放在一个空列中,作为数据框熊猫中的int范围

  14. 14

    从一列中提取数字并将其放在一个空列中,作为数据框熊猫中的int范围

  15. 15

    如何从管理面板中的字段中提取信息?

  16. 16

    使用任何可行的方法(PERL,SED,AWK)从文件行中提取信息到列中

  17. 17

    从 jsonb 中的列表中提取信息

  18. 18

    获取由R数据框中的另一列中的值分隔的一列的箱线图统计信息

  19. 19

    如何总结数据框中的每一列?

  20. 20

    根据两列中的信息向我的数据框添加一列

  21. 21

    如何从数据框中的列中提取字符串模式,并创建一个包含提取的字符串的新数据框列?

  22. 22

    如何检查数据框中的一列是否与另一数据框中的一列完全相等

  23. 23

    根据另一参考表在数据框中的一列中插入值

  24. 24

    如何从Wikipedia信息框中提取信息?

  25. 25

    从不同文件追加数组,并在数据中插入一列

  26. 26

    从不同文件追加数组,并在数据中插入一列

  27. 27

    如何将一列中的值映射到数据框的另一列?

  28. 28

    从数据框中的一列中以开头字母提取值

  29. 29

    ListView详细信息在最后一列中插入数据Visual Basic

热门标签

归档