为什么stringr :: str_detect无法检测到我的字符串？

debugcn 发表于 Dev

ich

我正在从pdf中提取行，并尝试使用来检测特定的字符串dplyr::filter(stringr::str_detect(my_column, 'my string'))。

该字符串似乎没有可检测的编码。

这是PDF文件的链接：https : //bioconductor.org/packages/release/bioc/vignettes/Rsubread/inst/doc/SubreadUsersGuide.pdf

该字符串是第42页的表（左列）中的短划线。

我尝试检测破折号的几种表示形式，但在本文档中找不到。

如何确定此破折号的编码，以便可以用它过滤我的小标题？

pdftools::pdf_text("SubreadUsersGuide.pdf") %>% 
  stringr::str_split(pattern = '\r') %>% 
  tibble::tibble(
    line = .
  ) %>% 
  tidyr::unnest(cols = line) %>% 
  dplyr::filter(
    stringr::str_detect(line, pattern = '^EM_DASH')
  )

维克多·史翠比维

你要匹配的字符不是一个破折号，这是一个MINUS标志属于符号，数学Unicode的类别，用U+2212代码。

要匹配字符串开头的任何一个或多个Unicode破折号+减号，可以使用

pattern = "^[\\p{Pd}\\xAD\\u2212]+"

这里，

^ -字符串开始
[ -角色类的开始：
- \p{Pd}-任何Puncutation，短跑字符
- \xAD -软连字符
- \u2212 -减号。
]+ -字符类的结尾，一个或多个出现。

请参阅regex演示。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-5

我来说两句

0条评论

登录后参与评论

来自分类Dev

为什么str（reversed（...））没有给我反向字符串？

来自分类Dev

为什么此代码找不到我集合中最长字符串的长度？

来自分类Dev

为什么将\ r \ n添加到我的字符串中？

来自分类Dev

为什么Android Studio无法检测到我的Nexus 6？

来自分类Dev

为什么SDL无法在Linux（PocketCHIP）上检测到我的iBuffalo游戏控制器？

来自分类Dev

为什么Network Manager无法检测到我的ZTE USB 3G调制解调器！

来自分类Dev

为什么未检测到我的Wacom Intuos平板电脑？

来自分类Dev

为什么Ubuntu无法检测到我的SD卡？

来自分类Dev

U-Boot i2c检测到我的设备（70），但Linux i2c未检测到我的设备。为什么？

来自分类Dev

为什么列上的stringr :: str_match返回矩阵？

来自分类Dev

为什么我的C程序无法检测到特殊字符？

来自分类Dev

在R中使用stringr :: str_detect（）分离具有常用字符的不同字符串

来自分类Dev

为什么我的Javascript无法检测到我的div之一？

来自分类Dev

为什么Pyngrok无法检测到我的配置文件？

来自分类Dev

为什么在C＃中未检测到我的GetKeyUp？

来自分类Dev

为什么Network Manager无法检测到我的ZTE USB 3G调制解调器！

来自分类Dev

为什么未检测到我的Wacom Intuos平板电脑？

来自分类Dev

为什么Ubuntu无法检测到我的SD卡？

来自分类Dev

为什么无法在数组中检测到更大的JavaScript字符串？

来自分类Dev

为什么在Fedora 23中未检测到我的（连接雷电）监视器

来自分类Dev

为什么ubuntu错误地检测到我的显卡？

来自分类Dev

为什么将undefined添加到我的字符串中？

来自分类Dev

为什么我无法删除字符串的空格？

来自分类Dev

为什么Elasticsearch无法检测到我的定制分析仪？

来自分类Dev

为什么我的字符串识别算法无法检测到正确的字符串？

来自分类Dev

为什么在实例化此类时未检测到我的数组属性？

来自分类Dev

为什么我的 Ubuntu 19 安装没有检测到我的集成网络摄像头？Cheese 和 Chrome 似乎无法访问它

来自分类Dev

为什么会检测到我的自定义 spaCy 实体类型？

来自分类Dev

为什么我无法检测到发送到我的 CommonDialog 的 Windows 消息？拦截它们的正确方法是什么？

Related 相关文章

文章