Java를 사용하여 용어 중복없이 텍스트 파일에서 용어 (단어) 추출

에멜 누엘

문서에서 추출 된 용어를 보유하는 새로운 데이터 유형의 사양 및 구현이 필요합니다. 이러한 데이터 유형은 각 인스턴스에서 용어의 중복을 허용하지 않습니다. 최소 :

1 제작자 방법,

3 가지 돌연변이 방법,

3 가지 관찰자 방법이 필요합니다.

또한 텍스트 문서 (사용자 제공)를 읽고 문서에 포함 된 각 용어를 추출하기 위해 별도의 테스트 프로그램을 구현해야합니다. 단일 문서에서 추출 된 용어는 새로 생성 된 데이터 유형의 인스턴스에 저장됩니다.

즉, 각 텍스트 문서에 대해 문서에서 추출 된 용어를 보유하기 위해 새로 생성 된 데이터의 인스턴스가 있습니다.

prstk

다음이 도움이되기를 바랍니다.

import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.ObjectOutputStream;
import java.io.PrintStream;
import java.util.HashSet;
import java.util.Iterator;
import java.util.Scanner;

public class Test { 
  public static void main (String args[]) throws IOException{
    Scanner sc2 = null;
    HashSet withoutDuplicatesHashSet = new HashSet();
    try {
        sc2 = new Scanner(new File("sample.txt"));

    } catch (FileNotFoundException e) {
        e.printStackTrace();  
    }
    while (sc2.hasNextLine()) {
        Scanner s2 = new Scanner(sc2.nextLine());
        boolean b;
        while (b = s2.hasNext()) {
            String s = s2.next();
            withoutDuplicatesHashSet.add(s);
            System.out.println(s);
        }
    }
    System.out.println(withoutDuplicatesHashSet);

    PrintStream out = new PrintStream(new FileOutputStream("WithoutDuplicates.txt"));
    Iterator hashSetIterator = withoutDuplicatesHashSet.iterator();
    while(hashSetIterator.hasNext()){
        out.println(hashSetIterator.next());
    }

  }
}

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

Java를 사용하여 텍스트 파일에서 특정 단어 옆에있는 단어 추출

분류에서Dev

Ruby를 사용하여 텍스트 파일에서 중복 단어 삭제

분류에서Dev

Java를 사용하여 텍스트 파일에서 두 단어 사이의 콘텐츠를 추출하는 방법은 무엇입니까?

분류에서Dev

dplyr 및 stringr를 사용하여 텍스트에서 단어 추출

분류에서Dev

.bat를 사용하여 두 단어 사이의 텍스트 추출

분류에서Dev

sed를 사용하여 파일에서 단어 추출

분류에서Dev

정규식을 사용하여 파이썬의 텍스트에서 특정 단어 추출

분류에서Dev

HTML / Javascript를 사용하여 텍스트 / 축약 번역기에서 단어 내 단어 반복 중지

분류에서Dev

파이썬을 사용하여 바이트 파일에서 텍스트를 어떻게 추출 할 수 있습니까?

분류에서Dev

텍스트 파일에서 특정 단어 뒤의 단어를 추출하여 특정 태그 사이에 XML 파일에 넣습니다.

분류에서Dev

자동 단축키를 사용하여 텍스트 파일에서 값 추출

분류에서Dev

VBA에서 MSXML을 사용하여 태그 이름으로 단일 HTML 요소의 텍스트를 어떻게 추출합니까?

분류에서Dev

VBA를 사용하여 단어로 표 앞에있는 텍스트 행 복사

분류에서Dev

php 또는 javascript를 사용하여 PDF 파일에서 텍스트와 이미지를 어떻게 추출 할 수 있습니까?

분류에서Dev

문자열 / 단어, 파일 이름을 검색하고 fso를 사용하여 새 시트로 추출

분류에서Dev

Bash를 사용하여 텍스트 파일에서 데이터 추출

분류에서Dev

Bash를 사용하여 텍스트 파일에서 데이터 추출

분류에서Dev

Pandas를 사용하여 텍스트 파일에서 헤더 데이터 추출

분류에서Dev

for 루프를 사용하여 텍스트 파일에서 데이터 추출

분류에서Dev

sed를 사용하여 두 단어 사이에 텍스트 가져 오기

분류에서Dev

REGEX를 사용하여 텍스트에서 단어 세기

분류에서Dev

무료 소프트웨어를 사용하여 PDF 파일에 텍스트 주석 및 이미지 추가

분류에서Dev

sed를 사용하여 파일에서 텍스트 추출

분류에서Dev

주어진 단어에서 정규식을 사용하여 단락 끝까지 텍스트 추출

분류에서Dev

파일 하위 집합의 정보를 사용하여 파일에서 단어 추출 (여러 단계)

분류에서Dev

re2 정규식을 사용하여 단일 마침표 사이의 모든 텍스트를 어떻게 추출 할 수 있습니까 (예 :`...`무시)?

분류에서Dev

파이썬 : 정규식을 사용하여 일본어 트위터 텍스트에서 이모티콘 텍스트 추출

분류에서Dev

Pandas에서 Regex를 사용하여 특정 단어 추출

분류에서Dev

텍스트에서 단어를 추출하여 벡터 생성

Related 관련 기사

  1. 1

    Java를 사용하여 텍스트 파일에서 특정 단어 옆에있는 단어 추출

  2. 2

    Ruby를 사용하여 텍스트 파일에서 중복 단어 삭제

  3. 3

    Java를 사용하여 텍스트 파일에서 두 단어 사이의 콘텐츠를 추출하는 방법은 무엇입니까?

  4. 4

    dplyr 및 stringr를 사용하여 텍스트에서 단어 추출

  5. 5

    .bat를 사용하여 두 단어 사이의 텍스트 추출

  6. 6

    sed를 사용하여 파일에서 단어 추출

  7. 7

    정규식을 사용하여 파이썬의 텍스트에서 특정 단어 추출

  8. 8

    HTML / Javascript를 사용하여 텍스트 / 축약 번역기에서 단어 내 단어 반복 중지

  9. 9

    파이썬을 사용하여 바이트 파일에서 텍스트를 어떻게 추출 할 수 있습니까?

  10. 10

    텍스트 파일에서 특정 단어 뒤의 단어를 추출하여 특정 태그 사이에 XML 파일에 넣습니다.

  11. 11

    자동 단축키를 사용하여 텍스트 파일에서 값 추출

  12. 12

    VBA에서 MSXML을 사용하여 태그 이름으로 단일 HTML 요소의 텍스트를 어떻게 추출합니까?

  13. 13

    VBA를 사용하여 단어로 표 앞에있는 텍스트 행 복사

  14. 14

    php 또는 javascript를 사용하여 PDF 파일에서 텍스트와 이미지를 어떻게 추출 할 수 있습니까?

  15. 15

    문자열 / 단어, 파일 이름을 검색하고 fso를 사용하여 새 시트로 추출

  16. 16

    Bash를 사용하여 텍스트 파일에서 데이터 추출

  17. 17

    Bash를 사용하여 텍스트 파일에서 데이터 추출

  18. 18

    Pandas를 사용하여 텍스트 파일에서 헤더 데이터 추출

  19. 19

    for 루프를 사용하여 텍스트 파일에서 데이터 추출

  20. 20

    sed를 사용하여 두 단어 사이에 텍스트 가져 오기

  21. 21

    REGEX를 사용하여 텍스트에서 단어 세기

  22. 22

    무료 소프트웨어를 사용하여 PDF 파일에 텍스트 주석 및 이미지 추가

  23. 23

    sed를 사용하여 파일에서 텍스트 추출

  24. 24

    주어진 단어에서 정규식을 사용하여 단락 끝까지 텍스트 추출

  25. 25

    파일 하위 집합의 정보를 사용하여 파일에서 단어 추출 (여러 단계)

  26. 26

    re2 정규식을 사용하여 단일 마침표 사이의 모든 텍스트를 어떻게 추출 할 수 있습니까 (예 :`...`무시)?

  27. 27

    파이썬 : 정규식을 사용하여 일본어 트위터 텍스트에서 이모티콘 텍스트 추출

  28. 28

    Pandas에서 Regex를 사용하여 특정 단어 추출

  29. 29

    텍스트에서 단어를 추출하여 벡터 생성

뜨겁다태그

보관