有没有一种方法可以从每个文本文件中提取子字符串,例如,比如说这是文本文件,但是有更多类似的行:
president, Donald Trump, 74, USA
Priminster, Boris Johnson, 56, UK
我将需要遍历每行并获取由逗号分隔的子字符串。因此,子串将是Donald Trump, 74
,以此类推。
您可以使用python中的简单split()
和join()
字符串方法轻松实现-
# You could open your file like this
#file1 = open('myfile.txt', 'r')
# For now I am assuming your file contains the following line of data.
# You could uncomment above line and use.
file1 = ['president, Donald Trump, 74, USA','president, Donald Trump, 74, USA']
for line in file1:
print("".join(line.split(',')[1:3]))
输出:
Donald Trump, 74
Donald Trump, 74
基本上,您只是在逗号处分割字符串(文件中的每一行),然后将字符串转换为数组。所以line.split(',')
会给-
['president', ' Donald Trump', ' 74', ' USA']
现在,我们只是将在上面的步骤中获得的列表的第二和第三元素结合在一起。这是通过",".join()
将结合列表中的每个元素来完成的','
。
另外,请注意,我们使用[1:3]
它将从列表中仅选择第一个和第二个元素。所以他们会给出上面显示的结果
希望这可以帮助 !
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句