我得到了一个具有“文本”和“ ID”列的Python数据框。我想确保“文本”列的每一行仅包含字符和空格。如果不是这种情况(数字,特殊字符等),我想打印所有文本及其ID以便确定问题出在哪里。有解决这个问题的主意吗?
使用正则表达式可能会更好,但是您可以尝试以下方法:
x = [None] * len(df['Text']) # create list with same length as df
i = 0
for text in df['Text']:
if all(j.isalpha() or j.isspace() for j in text):
x[i] = False # contains letters and whitespace
else:
x[i] = True # contains digits, special xters
i += 1
no_text_df = df[x] # contains all rows with digits and special xters in Text column
如果您的dataFrame行数非常多,则应用regex可能是一个更快的选择,但这也应该起作用。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句