csv 읽기 또는 쓰기에 대한 다중 프로세스

debugcn 에 게시 Dev

효 사유

그래서 지금 저는 csv 파일을 읽고 뭔가를 한 다음 다른 csv 파일에 저장하는 파이썬 코드를 작업하고 있습니다. 처리 할 대용량 CSV 파일이 5000 개가 넘습니다.

시간을 절약하기 위해 동시에 최소 200 개의 파일을 실행하는 다중 프로세스 패키지를 사용하려고합니다. 그러나 동시에 여러 스레드를 실행하지는 않지만 여기에 의사 코드가 있습니다.

from multiprocessing import Process

def f(inputfile,outputfile):
    open inputfile as reader
    open outputfile as writer
    #do sth

if __name__ == "__main__":
    for a list of inputfile_names/outputfile_names:
          p=Process(target=f,args=(input_names,output_names,))
          p.start()
          p.join()

파이썬 다중 프로세스 또는 스레드에 대한 지식이 거의 없으며 올바른 패키지를 사용하고 있는지 여부를 모르겠습니다.

도와주세요, 감사합니다!

(또한 나는 이것을 우분투 vm에서 실행하고 있으므로 셸 스크립트가 같은 일을 할 수 있고 더 빠른지 궁금합니다)

산수

for 루프 외부에 조인을 배치하십시오. 그렇지 않으면 각 프로세스가 시작된 직후에 조인됩니다.

from multiprocessing import Process
from time import sleep

def f(inputfile,outputfile):
    open inputfile as reader
    open outputfile as writer
    #do sth

if __name__ == "__main__":
    processes = []
    for a list of inputfile_names/outputfile_names:
          p=Process(target=f,args=(input_names,output_names,))
          p.start()
          processes.append(p)
    #sleep an increment of time until all processes are done
    while len(p for p in processes if p.is_alive()) > 0:
          sleep(0.1)

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-06-19

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

csv 읽기 또는 쓰기에 대한 다중 프로세스

csv 읽기 또는 쓰기에 대한 다중 프로세스

읽기 또는 쓰기 중 무한 재협상으로 인한 DoS

Julia에서 CSV 파일 읽기를위한 다중 스레딩

다중 하위 프로세스에서 데이터 읽기에 대한 파이프 문제

C #에 대한 액세스에서 다중 값 열 읽기

mmap : 이전에 읽기 전용으로 매핑 된 파일에 쓰는 다른 프로세스의 영향

배치 파일-USB를 읽기 / 쓰기에서 읽기 전용으로 또는 그 반대로 전환

수동으로 중지 될 때까지 파일에 대한 읽기 / 쓰기를 테스트하는 간단한 bash 스크립트?

부모 또는 기타 프로세스에 의한 프로세스 종료

다중 스레드 응용 프로그램에 대한 Linux 장치 드라이버에서 읽기 / 쓰기 및 릴리스 처리

읽기 가능한 파일에 프로세스의 최신 라인을 쓰는 방법

Bash : 파이프 된 "읽기 중"루프에서 벗어날 수 없습니다. 프로세스 대체 작업

Bash : 파이프 된 "읽기 중"루프에서 벗어날 수 없습니다. 프로세스 대체 작업

DynamicObject 또는 ExpandoObject에 대한 읽기 액세스에 대한 속성을 동적으로 추가

Excel / csv 액세스에서 가져 오기 프로그램에 대한 논리가 필요합니다.

서로 다른 데이터베이스에 읽기 / 쓰기 권한이없는, 다른 데이터베이스에서 SELECT와 프로 시저 실행

특정 앱의 HDD에 대한 쓰기 / 읽기 액세스를 제한하는 방법

Windows에서 프로세스 또는 stdout 대기

SUDO를 포함한 중요한 시스템 파일에 대한 소유권 / 읽기, 쓰기 변경

16.04-엉망진창 후 폴더 / 파일에 대한 읽기 쓰기 액세스를 부여하는 방법

txt를 다시 쓰는 C ++ 파일 읽기 / 쓰기 무한 루프

Karate-기능 파일에 대한 입력으로 사용되는 동일한 CSV 파일에 쓰는 방법

OS-X에서 프로세스에 대한 디렉토리 숨기기 또는 마스크

파일에서 다중 프로세스 읽기

디스크 쓰기를 추가로 조사하여 내 SSD에 쓰는 프로세스를 찾습니다.

디스크 쓰기를 추가로 조사하여 내 SSD에 쓰는 프로세스를 찾습니다.

클라이언트 소켓 프로그램에서 단일 읽기에 대한 서버 소켓의 다중 쓰기?

프로세스 마운트는 읽기 전용입니다.

하나 또는 두 개의 매개 변수에 대한 다시 쓰기 규칙

cacls없이 명령 줄 또는 VB 스크립트에서 읽기 / 쓰기 권한 변경