鉴于:
"kuku": "kdfjsfgsljfddnlfdsf"
"bubu": "slfjsdjlkfndvsdl;nsdf;vlankvdfs;lkndkfv"
"title": "dflkbjvndjlvbdknbdlkbvjndlkfdnbdlkbjdnb"
"tutu": "svfrol"
"lala": "dbd4431"
"title": "dfvbdfv"
我想提取所有以“title”开头的行。
请告知我该怎么做(我正在使用 R 并想要一个正则表达式)。
我正在尝试这个:
(["'])(title)\1:
并试图玩它。
一种选择是将文本文件作为 R 中的数据框读取
df <- read.table(text = '"kuku": "kdfjsfgsljfddnlfdsf"
"bubu": "slfjsdjlkfndvsdl;nsdf;vlankvdfs;lkndkfv"
"title": "dflkbjvndjlvbdknbdlkbvjndlkfdnbdlkbjdnb"
"tutu": "svfrol"
"lala": "dbd4431"
"title": "dfvbdfv"', sep = ":", stringsAsFactors = FALSE, strip.white = TRUE)
然后选择第一列以 "title"
df[grepl("^title", df$V1), ]
# V1 V2
#3 title dflkbjvndjlvbdknbdlkbvjndlkfdnbdlkbjdnb
#6 title dfvbdfv
如果您希望它作为原始字符串而不是不同的列,那么您可以将paste
它们返回
do.call(paste, c(df[grepl("^title", df$V1), ], sep = ":"))
#[1] "title:dflkbjvndjlvbdknbdlkbvjndlkfdnbdlkbjdnb" "title:dfvbdfv"
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句