Java를 사용하여 용어 중복없이 텍스트 파일에서 용어 (단어) 추출

debugcn 에 게시 Dev

에멜 누엘

문서에서 추출 된 용어를 보유하는 새로운 데이터 유형의 사양 및 구현이 필요합니다. 이러한 데이터 유형은 각 인스턴스에서 용어의 중복을 허용하지 않습니다. 최소 :

1 제작자 방법,

3 가지 돌연변이 방법,

3 가지 관찰자 방법이 필요합니다.

또한 텍스트 문서 (사용자 제공)를 읽고 문서에 포함 된 각 용어를 추출하기 위해 별도의 테스트 프로그램을 구현해야합니다. 단일 문서에서 추출 된 용어는 새로 생성 된 데이터 유형의 인스턴스에 저장됩니다.

즉, 각 텍스트 문서에 대해 문서에서 추출 된 용어를 보유하기 위해 새로 생성 된 데이터의 인스턴스가 있습니다.

prstk

다음이 도움이되기를 바랍니다.

import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.ObjectOutputStream;
import java.io.PrintStream;
import java.util.HashSet;
import java.util.Iterator;
import java.util.Scanner;

public class Test { 
  public static void main (String args[]) throws IOException{
    Scanner sc2 = null;
    HashSet withoutDuplicatesHashSet = new HashSet();
    try {
        sc2 = new Scanner(new File("sample.txt"));

    } catch (FileNotFoundException e) {
        e.printStackTrace();  
    }
    while (sc2.hasNextLine()) {
        Scanner s2 = new Scanner(sc2.nextLine());
        boolean b;
        while (b = s2.hasNext()) {
            String s = s2.next();
            withoutDuplicatesHashSet.add(s);
            System.out.println(s);
        }
    }
    System.out.println(withoutDuplicatesHashSet);

    PrintStream out = new PrintStream(new FileOutputStream("WithoutDuplicates.txt"));
    Iterator hashSetIterator = withoutDuplicatesHashSet.iterator();
    while(hashSetIterator.hasNext()){
        out.println(hashSetIterator.next());
    }

  }
}

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-05-31

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

Java를 사용하여 용어 중복없이 텍스트 파일에서 용어 (단어) 추출

Java를 사용하여 용어 중복없이 텍스트 파일에서 용어 (단어) 추출

Java를 사용하여 텍스트 파일에서 특정 단어 옆에있는 단어 추출

Ruby를 사용하여 텍스트 파일에서 중복 단어 삭제

Java를 사용하여 텍스트 파일에서 두 단어 사이의 콘텐츠를 추출하는 방법은 무엇입니까?

dplyr 및 stringr를 사용하여 텍스트에서 단어 추출

.bat를 사용하여 두 단어 사이의 텍스트 추출

sed를 사용하여 파일에서 단어 추출

정규식을 사용하여 파이썬의 텍스트에서 특정 단어 추출

HTML / Javascript를 사용하여 텍스트 / 축약 번역기에서 단어 내 단어 반복 중지

파이썬을 사용하여 바이트 파일에서 텍스트를 어떻게 추출 할 수 있습니까?

텍스트 파일에서 특정 단어 뒤의 단어를 추출하여 특정 태그 사이에 XML 파일에 넣습니다.

자동 단축키를 사용하여 텍스트 파일에서 값 추출

VBA에서 MSXML을 사용하여 태그 이름으로 단일 HTML 요소의 텍스트를 어떻게 추출합니까?

VBA를 사용하여 단어로 표 앞에있는 텍스트 행 복사

php 또는 javascript를 사용하여 PDF 파일에서 텍스트와 이미지를 어떻게 추출 할 수 있습니까?

문자열 / 단어, 파일 이름을 검색하고 fso를 사용하여 새 시트로 추출

Bash를 사용하여 텍스트 파일에서 데이터 추출

Bash를 사용하여 텍스트 파일에서 데이터 추출

Pandas를 사용하여 텍스트 파일에서 헤더 데이터 추출

for 루프를 사용하여 텍스트 파일에서 데이터 추출

sed를 사용하여 두 단어 사이에 텍스트 가져 오기

REGEX를 사용하여 텍스트에서 단어 세기

무료 소프트웨어를 사용하여 PDF 파일에 텍스트 주석 및 이미지 추가

sed를 사용하여 파일에서 텍스트 추출

주어진 단어에서 정규식을 사용하여 단락 끝까지 텍스트 추출

파일 하위 집합의 정보를 사용하여 파일에서 단어 추출 (여러 단계)

re2 정규식을 사용하여 단일 마침표 사이의 모든 텍스트를 어떻게 추출 할 수 있습니까 (예 :`...`무시)?

파이썬 : 정규식을 사용하여 일본어 트위터 텍스트에서 이모티콘 텍스트 추출

Pandas에서 Regex를 사용하여 특정 단어 추출

텍스트에서 단어를 추출하여 벡터 생성