使用以下命令从文本文件中删除所有数字和字母数字字符

马特·瑞安(Matt Ryan)

我有2个文本文件:

File1-此文件的格式为 user_id tweet_id tweet_text

文件1

60730027    6298443824  thank you echo park. you've changed A LOT, but as long as I'm getting paid to make you move, I'm still with it! 2009-12-03 02:54:10
60730027    6297282530  fat Albert Einstein goin in right now over here!!!  2009-12-03 01:35:22

File2
该文件的格式为genome_id name ascii_name

4045417 Southwest Indent    Southwest Indent
4045418 Southeast Point     Southeast Point     

以下是读取文件1的代码段:

public void readfromFile() throws FileNotFoundException {
    Scanner inputStream;
    String source=null;
     FileInputStream file = new FileInputStream("file1.txt");   
        String regex = "/[a-zA-Z ]+/";
        Scanner fileScan = new Scanner(file); 

        while(fileScan.hasNextLine()){
            word = fileScan.nextLine();
            word = word.replaceAll(regex, "").toLowerCase();
            PrintWriter outputStreamName = new PrintWriter(new FileOutputStream("temp.txt"));
            outputStreamName.printf("%s",word);
}

我的目的是首先用空值替换user_id,tweet_id,genome_id中存在的数据。然后将大写的值转换为小写。但是,现在只要此代码处理file1,文本文件都不会更改。我也想知道发生了什么事。当我将其输出到控制台时,我得到了输出。

预期产量:

thank you echo park youve changed a lot but as long as im getting paid to make you move im still with it

fat albert einstein goin in right now over here
布拉吉

根据期望的输出,您想要替换字母,点和单词之间的空格以外的所有内容。

[^a-zA-Z. ]+|(?<=\d)\s*(?=\d)|(?<=\D)\s*(?=\d)|(?<=\d)\s*(?=\D)

这是在线演示

或尝试不使用环视

[^a-zA-Z. ]+|\d\s+\d|\D\s+\d|\d\s+\D

在这里\s匹配任何空格字符[\r\n\t\f ]

样例代码:

String regex = "[^a-zA-Z. ]+|(?<=\\d)\\s*(?=\\d)|(?<=\\D)\\s*(?=\\d)|(?<=\\d)\\s*(?=\\D)";
str.replaceAll(regex,"");

输出:

thank you echo park. youve changed A LOT but as long as Im getting paid to make you move Im still with it
fat Albert Einstein goin in right now over here

'同时从输出中排除,请使用,[^a-zA-Z.' ]+I'myou've更改为Imyouve

最好只使用[a-zA-Z']+所有单词。这是演示

样例代码:

String str = "60730027    6297282530  fat Albert Einstein goin in right now over here!!!  2009-12-03 01:35:22 ";
Pattern p = Pattern.compile("[a-zA-Z']+");
Matcher m = p.matcher(str);
while (m.find()) {
    System.out.print(m.group()+" ");
}

输出:

fat Albert Einstein goin in right now over here 

注意:因此,您正在检查下一行

改变:

source = inputStream.next();

到:

source = inputStream.nextLine();

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

从文本文件中提取所有数字并将其存储在另一个文件中

来自分类Dev

Java从字符串的开头和结尾删除所有非字母数字字符

来自分类Dev

在某些单词(密码/ sed / awk)之后将字母数字字符串插入文本文件

来自分类Dev

如何从变量中删除所有非数字字符

来自分类Dev

显示文本文件中的所有数据

来自分类Dev

如何快速读取和解析带有数字的文本文件(在C中)?

来自分类Dev

匹配之前或之后不带字母或带重音字母的所有数字字符

来自分类Dev

从带有数字的文本文件中读取字母

来自分类Dev

如何找到文本文件中所有数字的平均值

来自分类Dev

如何使用正则表达式从字符串中删除所有非字母数字字符(“#”除外)?

来自分类Dev

Excel-从字母数字字符串中提取所有数字

来自分类Dev

使用python删除阿拉伯字符文本文件中的特殊字符,数字

来自分类Dev

Findall()找不到文本文件中的所有数字

来自分类Dev

如何将几个文本文件中唯一的所有数字导出到另一个文件中?

来自分类Dev

从文本文件中删除所有非数字字符

来自分类Dev

如何调整文本文件中的数字字段

来自分类Dev

正则表达式删除非字母数字字符和点后的所有字符?

来自分类Dev

如何使用R从字符串中删除所有数字和逗号(除了任何紧跟$的数字)?

来自分类Dev

BASH-如何删除文本文件中的所有数字,除非它们是特定字符串的一部分?

来自分类Dev

如何计算文本文件中所有数字的总和

来自分类Dev

处理具有数字和字符串的文本文件外壳脚本

来自分类Dev

使用sed删除目录中所有文本文件中的字符

来自分类Dev

用文本文件中的单个单词替换所有数字

来自分类Dev

从带有数字的文本文件中读取字母

来自分类Dev

替换文本文件中的数字字符串

来自分类Dev

PHP:array_diff 删除字符串中没有数字字符的所有元素

来自分类Dev

如何删除文本文件中不是大于特定值的数字的所有行?(包括字符串)

来自分类Dev

从删除所有非字母数字字符的字符串中获取列表

来自分类Dev

如何从文本文件中删除仅数字行?

Related 相关文章

  1. 1

    从文本文件中提取所有数字并将其存储在另一个文件中

  2. 2

    Java从字符串的开头和结尾删除所有非字母数字字符

  3. 3

    在某些单词(密码/ sed / awk)之后将字母数字字符串插入文本文件

  4. 4

    如何从变量中删除所有非数字字符

  5. 5

    显示文本文件中的所有数据

  6. 6

    如何快速读取和解析带有数字的文本文件(在C中)?

  7. 7

    匹配之前或之后不带字母或带重音字母的所有数字字符

  8. 8

    从带有数字的文本文件中读取字母

  9. 9

    如何找到文本文件中所有数字的平均值

  10. 10

    如何使用正则表达式从字符串中删除所有非字母数字字符(“#”除外)?

  11. 11

    Excel-从字母数字字符串中提取所有数字

  12. 12

    使用python删除阿拉伯字符文本文件中的特殊字符,数字

  13. 13

    Findall()找不到文本文件中的所有数字

  14. 14

    如何将几个文本文件中唯一的所有数字导出到另一个文件中?

  15. 15

    从文本文件中删除所有非数字字符

  16. 16

    如何调整文本文件中的数字字段

  17. 17

    正则表达式删除非字母数字字符和点后的所有字符?

  18. 18

    如何使用R从字符串中删除所有数字和逗号(除了任何紧跟$的数字)?

  19. 19

    BASH-如何删除文本文件中的所有数字,除非它们是特定字符串的一部分?

  20. 20

    如何计算文本文件中所有数字的总和

  21. 21

    处理具有数字和字符串的文本文件外壳脚本

  22. 22

    使用sed删除目录中所有文本文件中的字符

  23. 23

    用文本文件中的单个单词替换所有数字

  24. 24

    从带有数字的文本文件中读取字母

  25. 25

    替换文本文件中的数字字符串

  26. 26

    PHP:array_diff 删除字符串中没有数字字符的所有元素

  27. 27

    如何删除文本文件中不是大于特定值的数字的所有行?(包括字符串)

  28. 28

    从删除所有非字母数字字符的字符串中获取列表

  29. 29

    如何从文本文件中删除仅数字行?

热门标签

归档