在R中使用Regex获取Twitter @Username

切尔诺夫

如何在R中使用正则表达式从文本字符串中提取Twitter用户名?

我试过了

library(stringr)

theString <- '@foobar Foobar! and @foo (@bar) but not [email protected]'

str_extract_all(string=theString,pattern='(?:^|(?:[^-a-zA-Z0-9_]))@([A-Za-z]+[A-Za-z0-9_]+)')

但是,我最后得到@foobar@foo并且(@bar其中包含不需要的括号。

我怎样才能得到公正@foobar@foo@bar作为输出?

Ben

这是一种适用于的方法R

theString <- '@foobar Foobar! and @foo (@bar) but not [email protected]'
theString1 <- unlist(strsplit(theString, " "))
regex <- "(^|[^@\\w])@(\\w{1,15})\\b"
idx <- grep(regex, theString1, perl = T)
theString1[idx]
[1] "@foobar" "@foo"    "(@bar)"

如果您想在中使用@Jerry的答案R

regex <- "@([A-Za-z]+[A-Za-z0-9_]+)(?![A-Za-z0-9_]*\\.)"
idx <- grep(regex, theString1, perl = T)
theString1[idx]
[1] "@foobar" "@foo"    "(@bar)" 

但是,这两种方法都包含不需要的括号。

更新这将使您开始时没有括号或任何其他标点符号(下划线除外,因为用户名中允许使用下划线)

theString <- '@foobar Foobar! and @fo_o (@bar) but not [email protected]'
theString1 <- unlist(strsplit(theString, " "))
regex1 <- "(^|[^@\\w])@(\\w{1,15})\\b" # get strings with @
regex2 <- "[^[:alnum:]@_]"             # remove all punctuation except _ and @
users <- gsub(regex2, "", theString1[grep(regex1, theString1, perl = T)])
users

[1] "@foobar" "@fo_o"   "@bar"

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在JavaScript中使用$ row ['username']

来自分类Dev

错误1045(28000):用户'username'@'%'的访问被拒绝(使用密码:是)

来自分类Dev

如何在codeigniter中使url / username?

来自分类Dev

无法在基本模板中使用user.username

来自分类Dev

使用$ username时,会话中存储的用户名更改

来自分类Dev

错误:使用SqlCredential对象登录用户“ domain \ username”失败

来自分类Dev

How can I match a twitter username with angular ui router

来自分类Dev

Trying to write REGEX for username validation in Rails

来自分类Dev

创建将使用动态%username%的快捷方式

来自分类Dev

1045,“拒绝访问用户'username'@'NOT-local'(使用密码:是)”

来自分类Dev

Sublime文本构建系统,使用〜和/ home / username目录

来自分类Dev

连接失败:用户“ username'@'localhost”的访问被拒绝(使用密码:是)

来自分类Dev

Powershell:获取Windows用户目录的大小(C:\ Users \ <UserName>)

来自分类Dev

如果推文以@username开头,则Twitter API给出空白响应

来自分类Dev

如何从GitHub页面获取域名username.io?

来自分类Dev

错误1045(28000):用户'username'@'%'的访问被拒绝(使用密码:是)

来自分类Dev

如何在codeigniter中使url / username?

来自分类Dev

获取用户= $ _session ['username']的行数

来自分类Dev

如何获取对API进行调用的用户的UserName?

来自分类Dev

在全局目录中使用DirectorySearcher查找DOMAIN \ username

来自分类Dev

JDBC:尝试使用SQL查询获取UserName列

来自分类Dev

如何自定义CreateUserWizard以获取UserId和UserName值?

来自分类Dev

运行`chown -R username:usergroup / *`后无法sudo

来自分类Dev

获取安全组成员Domain \ Username

来自分类Dev

如何获取git repo中<username>应用的最早的更改?

来自分类Dev

如何在 VBScript 中获取 %username%?

来自分类Dev

在 StreamReader 上使用 Environment.UserName

来自分类Dev

如何在 GraphQL 中通过 userName 获取用户?

来自分类Dev

获取以 username:password@ 为前缀的 url

Related 相关文章

  1. 1

    在JavaScript中使用$ row ['username']

  2. 2

    错误1045(28000):用户'username'@'%'的访问被拒绝(使用密码:是)

  3. 3

    如何在codeigniter中使url / username?

  4. 4

    无法在基本模板中使用user.username

  5. 5

    使用$ username时,会话中存储的用户名更改

  6. 6

    错误:使用SqlCredential对象登录用户“ domain \ username”失败

  7. 7

    How can I match a twitter username with angular ui router

  8. 8

    Trying to write REGEX for username validation in Rails

  9. 9

    创建将使用动态%username%的快捷方式

  10. 10

    1045,“拒绝访问用户'username'@'NOT-local'(使用密码:是)”

  11. 11

    Sublime文本构建系统,使用〜和/ home / username目录

  12. 12

    连接失败:用户“ username'@'localhost”的访问被拒绝(使用密码:是)

  13. 13

    Powershell:获取Windows用户目录的大小(C:\ Users \ <UserName>)

  14. 14

    如果推文以@username开头,则Twitter API给出空白响应

  15. 15

    如何从GitHub页面获取域名username.io?

  16. 16

    错误1045(28000):用户'username'@'%'的访问被拒绝(使用密码:是)

  17. 17

    如何在codeigniter中使url / username?

  18. 18

    获取用户= $ _session ['username']的行数

  19. 19

    如何获取对API进行调用的用户的UserName?

  20. 20

    在全局目录中使用DirectorySearcher查找DOMAIN \ username

  21. 21

    JDBC:尝试使用SQL查询获取UserName列

  22. 22

    如何自定义CreateUserWizard以获取UserId和UserName值?

  23. 23

    运行`chown -R username:usergroup / *`后无法sudo

  24. 24

    获取安全组成员Domain \ Username

  25. 25

    如何获取git repo中<username>应用的最早的更改?

  26. 26

    如何在 VBScript 中获取 %username%?

  27. 27

    在 StreamReader 上使用 Environment.UserName

  28. 28

    如何在 GraphQL 中通过 userName 获取用户?

  29. 29

    获取以 username:password@ 为前缀的 url

热门标签

归档