Java / Apache Tika : URL에서 파일의 마지막 수정 / 생성 된 속성을 가져 오는 방법

jshapy8

Java를 사용하여 HTTP 서버에서 파일의 마지막 수정 시간과 생성 시간을 가져오고 싶습니다. 파일은 특정 URL에 있습니다. 메서드 는 HTTP 헤더에서 Last-Modified 속성을 사용 URLConnection하고 HttpURLConnection산출하지만 이것은 실제 파일 생성 날짜가 아닙니다.

나는 Apache Tika 가 작업을위한 라이브러리 라는 것을 읽었 습니다. 그러나 원하는대로 작동하는 예제를 찾을 수 없습니다. 가장 가까운 예가 여기에 있습니다 . 그러나 해당 게시물에 제공된 코드를 실행하면 마지막으로 수정 된 속성이 생성되지 않습니다.

답변에 제공된 접근 방식을 부분적으로 사용 하고 있지만 현재는 아무것도 인쇄하지 않습니다.

Parser parser = new AutoDetectParser();
BodyContentHandler handler = new BodyContentHandler();
Metadata metadata = new Metadata();


URI u = new URI("https://sec.gov/Archives/edgar/full-index/2015/QTR4/master.idx");
InputStream is = new BufferedInputStream(new FileInputStream(new File(u)));

parser.parse(is, handler, metadata, new ParseContext());
System.out.println("Creation Date" + metadata.get(Metadata.CREATION_DATE));
System.out.println("Last Modified Date" + metadata.get(Metadata.LAST_MODIFIED));
YMomb

URLConnection을 사용하여 파일을 다운로드 할 때 HTTP 헤더는 Tika에서 숨겨집니다.

여기에서 Tika가 읽을 수있는 모든 내용은 파일을 저장하고 스트림을 연 경우와 동일합니다.

즉, 파일을 저장할 때 생성 날짜와 마지막 수정 날짜가 사용됩니다 (OS 브라우저 [Windows 탐색기, 노틸러스 ...]를 사용하여 볼 수있는 것과 동일).

해당 파일에서 HTTP 헤더 만 읽어야하는 경우 Tika를 사용하지 말고 HTTPUrlConnection( https://hc.apache.org/httpcomponents-client-4.5.x/ ) 또는 이 다른 질문 에서 제안 된 방법 .

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

지시문에서 템플릿 URL의 html 파일에 정의 된 속성 값을 가져 오는 방법

분류에서Dev

Postman-필수 속성의 마지막 발생에 대한 JSON 응답에서 값을 가져 오는 방법

분류에서Dev

C ++의 잠긴 파일에서 생성, 마지막 액세스 및 마지막 수정 시간 가져 오기

분류에서Dev

Angularjs의 JSON에서 특정 속성의 마지막 값을 가져 오는 방법

분류에서Dev

Python 디렉터리에서 마지막으로 수정 된 파일 4 개를 가져 오는 방법

분류에서Dev

Perl에서 파일 마지막 수정 파일 속성을 설정하는 방법

분류에서Dev

다른 명령에서 인수로 사용할 수 있도록 마지막으로 수정 된 파일을 가져 오는 방법은 무엇입니까?

분류에서Dev

많은 파일의 생성 및 마지막 수정 시간을 얻는 가장 빠른 방법

분류에서Dev

@Pattern에서 속성 파일의 값을 가져 오는 방법

분류에서Dev

날짜 매개 변수를 전달하지 않고 디렉토리에서 마지막으로 생성 된 3 개의 파일을 보는 방법

분류에서Dev

Linux 시스템에서 마지막 부팅 이후에 생성 된 프로세스 수를 가져 오는 방법

분류에서Dev

마지막으로 수정 된 폴더에서 파일을 가져 오는 배치 파일

분류에서Dev

OS 디렉토리에서 지난 24 시간 동안 생성 된 모든 파일을 가져 오는 방법

분류에서Dev

Android 마시멜로에서 생성 된 비디오 파일 콘텐츠를 가져 오는 방법

분류에서Dev

생성 된 지 30 일 후 arrayList에서 객체를 가져 오는 방법

분류에서Dev

제품 인벤토리에서 마지막으로 수정 된 행을 가져 오는 방법

분류에서Dev

Java-마지막 수정 날짜별로 정렬 된 폴더에서 마지막 업데이트 파일을 여는 방법은 무엇입니까?

분류에서Dev

미디어 파일 생성 및 마지막 수정 날짜 가져 오기

분류에서Dev

JLabel 클릭을 통해 동적으로 생성 된 Java의 JTextField에서 값을 가져 오는 방법

분류에서Dev

emacs-lisp 파일에 정의 된 함수 목록을 가져 오는 방법

분류에서Dev

지정된 온톨로지에서 정의 된 rdfs : range없이 데이터 유형 속성을 가져 오는 방법

분류에서Dev

Python을 사용하여 폴더에서 마지막으로 수정 된 파일의 시간을 얻는 방법

분류에서Dev

테스트 중에 sbt (resourceGenerators)에 의해 생성 된 파일을 가져 오는 방법은 무엇입니까?

분류에서Dev

ASP.NET MVC에서 자동 생성 된 파일에 삽입 된 속성 특성을 유지하는 방법

분류에서Dev

CloudFormation에서 수동으로 생성 된 dynamodb 테이블의 streamArn을 가져 오는 방법

분류에서Dev

DataTable에서 중복, 두 속성을 지정하여 마지막 가져 오기

분류에서Dev

마지막으로 생성 된 텍스트 파일을 여는 방법?

분류에서Dev

C # Winforms에서 이미지의 모든 파일 속성을 가져 오는 방법

분류에서Dev

Python 3의 특정 클래스에 속하는 모든 속성 (상속 된 속성 제외)의 값을 가져 오는 방법

Related 관련 기사

  1. 1

    지시문에서 템플릿 URL의 html 파일에 정의 된 속성 값을 가져 오는 방법

  2. 2

    Postman-필수 속성의 마지막 발생에 대한 JSON 응답에서 값을 가져 오는 방법

  3. 3

    C ++의 잠긴 파일에서 생성, 마지막 액세스 및 마지막 수정 시간 가져 오기

  4. 4

    Angularjs의 JSON에서 특정 속성의 마지막 값을 가져 오는 방법

  5. 5

    Python 디렉터리에서 마지막으로 수정 된 파일 4 개를 가져 오는 방법

  6. 6

    Perl에서 파일 마지막 수정 파일 속성을 설정하는 방법

  7. 7

    다른 명령에서 인수로 사용할 수 있도록 마지막으로 수정 된 파일을 가져 오는 방법은 무엇입니까?

  8. 8

    많은 파일의 생성 및 마지막 수정 시간을 얻는 가장 빠른 방법

  9. 9

    @Pattern에서 속성 파일의 값을 가져 오는 방법

  10. 10

    날짜 매개 변수를 전달하지 않고 디렉토리에서 마지막으로 생성 된 3 개의 파일을 보는 방법

  11. 11

    Linux 시스템에서 마지막 부팅 이후에 생성 된 프로세스 수를 가져 오는 방법

  12. 12

    마지막으로 수정 된 폴더에서 파일을 가져 오는 배치 파일

  13. 13

    OS 디렉토리에서 지난 24 시간 동안 생성 된 모든 파일을 가져 오는 방법

  14. 14

    Android 마시멜로에서 생성 된 비디오 파일 콘텐츠를 가져 오는 방법

  15. 15

    생성 된 지 30 일 후 arrayList에서 객체를 가져 오는 방법

  16. 16

    제품 인벤토리에서 마지막으로 수정 된 행을 가져 오는 방법

  17. 17

    Java-마지막 수정 날짜별로 정렬 된 폴더에서 마지막 업데이트 파일을 여는 방법은 무엇입니까?

  18. 18

    미디어 파일 생성 및 마지막 수정 날짜 가져 오기

  19. 19

    JLabel 클릭을 통해 동적으로 생성 된 Java의 JTextField에서 값을 가져 오는 방법

  20. 20

    emacs-lisp 파일에 정의 된 함수 목록을 가져 오는 방법

  21. 21

    지정된 온톨로지에서 정의 된 rdfs : range없이 데이터 유형 속성을 가져 오는 방법

  22. 22

    Python을 사용하여 폴더에서 마지막으로 수정 된 파일의 시간을 얻는 방법

  23. 23

    테스트 중에 sbt (resourceGenerators)에 의해 생성 된 파일을 가져 오는 방법은 무엇입니까?

  24. 24

    ASP.NET MVC에서 자동 생성 된 파일에 삽입 된 속성 특성을 유지하는 방법

  25. 25

    CloudFormation에서 수동으로 생성 된 dynamodb 테이블의 streamArn을 가져 오는 방법

  26. 26

    DataTable에서 중복, 두 속성을 지정하여 마지막 가져 오기

  27. 27

    마지막으로 생성 된 텍스트 파일을 여는 방법?

  28. 28

    C # Winforms에서 이미지의 모든 파일 속성을 가져 오는 방법

  29. 29

    Python 3의 특정 클래스에 속하는 모든 속성 (상속 된 속성 제외)의 값을 가져 오는 방법

뜨겁다태그

보관