Unix 정렬을 사용하여 폴더에있는 수백만 개의 텍스트 파일 정렬

굽히다

NZParsed라는 폴더에 많은 파일 (수백만, 즉 약 2.5m) .txt 파일을 정렬하려고합니다.

폴더의 모든 파일 이름은 1.txt 2.txt와 같이 이름이 25xxxxx.txt까지 지정됩니다.

이클립스에서 다음 명령을 실행 한 후 :

os.system("sort -k1,1 -k3,3n -k4,4n -y 1048576 /home/viraj/NZ/NZParsed/* -o /home/viraj/NZ/SplitIndex/abcd.txt")

오류가 발생합니다.

sh: 1: sort: Argument list too long

누구든지이 모든 파일을 하나의 파일로 정렬하고 이클립스에서 다음 명령을 사용하여 분할 할 수있는 다른 방법을 말할 수 있습니까?

os.system("split -C 200m /home/viraj/NZ/SplitIndex/abcd.txt /home/viraj/NZ/SplitIndex/")
멘돈

문제는 이클립스 또는 파이썬과 관련이 없습니다. ARG_MAX 한계에 도달하고 있습니다. 자세한 내용은 여기를 참조 하십시오. 그러나 간략히 이것은 명령에 대한 인수 목록이 될 수있는 바이트 수의 한계입니다.

따라서이를 방지 sort하려면 파일을 나열하지 않는 방식으로해야합니다. 예를 들면 :

for i in /home/viraj/NZ/NZParsed/*; do cat "$i" ; done |
    sort -k1,1 -k3,3n -k4,4n -y 1048576 > /home/viraj/NZ/SplitIndex/abcd.txt

위의 명령은 cat각 파일을 수행 한 다음 sort명령을 통해 모든 파일의 내용을 전달합니다 . 이렇게하면 파일이 나열되지 않고 ARG_MAX문제가 발생 하지 않습니다 .

또 다른 접근 방식은 find의 -exec옵션 을 사용하는 것입니다 .

find /home/viraj/NZ/NZParsed/ -type f -name '[0-9]*.txt' -exec cat {} + | 
    sort -k1,1 -k3,3n -k4,4n -y 1048576 > /home/viraj/NZ/SplitIndex/abcd.txt

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

Unix 정렬을 사용하여 폴더에있는 수백만 개의 텍스트 파일 정렬

분류에서Dev

C에서 fork ()를 사용하여 폴더에있는 각 텍스트 파일의 행을 병렬로 계산

분류에서Dev

Python을 사용하여 텍스트 파일의 특정 인덱스 값 정렬

분류에서Dev

스크립트를 사용하여 180 만 개의 레코드가있는 파일 정렬

분류에서Dev

bash를 사용하여 man 페이지에서 볼 수있는 텍스트 파일의 형식을 지정하는 방법 (텍스트 정렬, 더 이상 없음)

분류에서Dev

gedit를 사용하여 텍스트 파일의 줄을 알파벳순으로 정렬하는 방법

분류에서Dev

gedit를 사용하여 텍스트 파일의 줄을 알파벳순으로 정렬하는 방법

분류에서Dev

정의 된 여백을 사용하여 여러 행의 텍스트를 정렬하는 방법

분류에서Dev

파일을 정렬하고 다른 이름의 개별 폴더에 넣는 Powershell 스크립트

분류에서Dev

텍스트 파일의 숫자를 사용하여 파이썬에서 텍스트 파일을 정렬하는 방법

분류에서Dev

Sqlite 카운터를 사용하여 수백만 개의 텍스트 파일을 병렬로 프로파일 링 하시겠습니까?

분류에서Dev

여러 텍스트 파일을 만든 날짜별로 정렬 된 하나의 텍스트 파일로 결합하는 방법은 무엇입니까?

분류에서Dev

여러 텍스트 파일을 만든 날짜별로 정렬 된 하나의 텍스트 파일로 결합하는 방법은 무엇입니까?

분류에서Dev

폴더에있는 수백만 개의 (작은) 텍스트 파일

분류에서Dev

FTP 폴더의 파일을 수정 시간별로 정렬하는 방법

분류에서Dev

bash 스크립트를 사용하여 파일의 텍스트 정렬

분류에서Dev

sed를 사용하여 문제가있는 텍스트 파일의 줄 수정

분류에서Dev

텍스트 파일의 블록을 열 단위로 재정렬하는 방법

분류에서Dev

텍스트 파일로 정렬하는 짝수 및 홀수

분류에서Dev

UNIX를 사용하여 텍스트 파일의 특정 행 삭제

분류에서Dev

텍스트 파일에서 정보를 추출하여 Unix의 명령에 사용

분류에서Dev

들여 쓰기 된 텍스트를 정렬하여 두 개의 텍스트 파일 정렬

분류에서Dev

PowerShell을 사용하여 파이프로 구분 된 텍스트 파일의 내용을 수정하는 방법

분류에서Dev

FTP 폴더의 Dolphin 15.12.3에서 "수정 된 날짜"로 파일을 정렬하는 방법

분류에서Dev

PHP를 사용하여 텍스트 파일에서 정렬되지 않은 목록 만들기

분류에서Dev

미디어 화면을 사용하여 모바일에서 CSS의 중앙에 텍스트 정렬

분류에서Dev

30 만 개 이상의 텍스트 줄을 파일 이름별로 배열로 정렬하는 방법은 무엇입니까?

분류에서Dev

Scala의 사용자 지정 함수로 큰 텍스트 파일의 줄을 어떻게 정렬 할 수 있습니까?

분류에서Dev

CMD, 소프트웨어 등을 사용하여 폴더에있는 각 파일의 생성 날짜를 자동으로 "마지막 수정"날짜로 설정

Related 관련 기사

  1. 1

    Unix 정렬을 사용하여 폴더에있는 수백만 개의 텍스트 파일 정렬

  2. 2

    C에서 fork ()를 사용하여 폴더에있는 각 텍스트 파일의 행을 병렬로 계산

  3. 3

    Python을 사용하여 텍스트 파일의 특정 인덱스 값 정렬

  4. 4

    스크립트를 사용하여 180 만 개의 레코드가있는 파일 정렬

  5. 5

    bash를 사용하여 man 페이지에서 볼 수있는 텍스트 파일의 형식을 지정하는 방법 (텍스트 정렬, 더 이상 없음)

  6. 6

    gedit를 사용하여 텍스트 파일의 줄을 알파벳순으로 정렬하는 방법

  7. 7

    gedit를 사용하여 텍스트 파일의 줄을 알파벳순으로 정렬하는 방법

  8. 8

    정의 된 여백을 사용하여 여러 행의 텍스트를 정렬하는 방법

  9. 9

    파일을 정렬하고 다른 이름의 개별 폴더에 넣는 Powershell 스크립트

  10. 10

    텍스트 파일의 숫자를 사용하여 파이썬에서 텍스트 파일을 정렬하는 방법

  11. 11

    Sqlite 카운터를 사용하여 수백만 개의 텍스트 파일을 병렬로 프로파일 링 하시겠습니까?

  12. 12

    여러 텍스트 파일을 만든 날짜별로 정렬 된 하나의 텍스트 파일로 결합하는 방법은 무엇입니까?

  13. 13

    여러 텍스트 파일을 만든 날짜별로 정렬 된 하나의 텍스트 파일로 결합하는 방법은 무엇입니까?

  14. 14

    폴더에있는 수백만 개의 (작은) 텍스트 파일

  15. 15

    FTP 폴더의 파일을 수정 시간별로 정렬하는 방법

  16. 16

    bash 스크립트를 사용하여 파일의 텍스트 정렬

  17. 17

    sed를 사용하여 문제가있는 텍스트 파일의 줄 수정

  18. 18

    텍스트 파일의 블록을 열 단위로 재정렬하는 방법

  19. 19

    텍스트 파일로 정렬하는 짝수 및 홀수

  20. 20

    UNIX를 사용하여 텍스트 파일의 특정 행 삭제

  21. 21

    텍스트 파일에서 정보를 추출하여 Unix의 명령에 사용

  22. 22

    들여 쓰기 된 텍스트를 정렬하여 두 개의 텍스트 파일 정렬

  23. 23

    PowerShell을 사용하여 파이프로 구분 된 텍스트 파일의 내용을 수정하는 방법

  24. 24

    FTP 폴더의 Dolphin 15.12.3에서 "수정 된 날짜"로 파일을 정렬하는 방법

  25. 25

    PHP를 사용하여 텍스트 파일에서 정렬되지 않은 목록 만들기

  26. 26

    미디어 화면을 사용하여 모바일에서 CSS의 중앙에 텍스트 정렬

  27. 27

    30 만 개 이상의 텍스트 줄을 파일 이름별로 배열로 정렬하는 방법은 무엇입니까?

  28. 28

    Scala의 사용자 지정 함수로 큰 텍스트 파일의 줄을 어떻게 정렬 할 수 있습니까?

  29. 29

    CMD, 소프트웨어 등을 사용하여 폴더에있는 각 파일의 생성 날짜를 자동으로 "마지막 수정"날짜로 설정

뜨겁다태그

보관