지난 21 일이 포함 된 파일 이름 읽기

debugcn 에 게시 Dev

nak5120

Microsoft Azure Storage Explorer에 마루 파일 이름이 있습니다.

파일 이름은 다음과 같습니다.

dataset_2019_11_19-19.parquet
dataset_2020_01_19-20.parquet
dataset_2020_01_20-20.parquet
dataset_2020_01_21-20.parquet
dataset_2020_01_22-20.parquet

2020 년에 대한 모든 데이터를 읽으려면 다음과 같이 진행합니다. 여기서 와일드 카드를 사용하여 2020 년 이후에 무엇이든 가져옵니다.

datapath_v3_indata_imptp = "wasbs://[email protected]/first_folder/dataset_2020*"
df_indata_v3_imptp=spark.read.format("parquet").option("header", "true").load(datapath_v3_indata_imptp)

지난 21 일 동안 만 데이터를 얻으려면 어떻게해야합니까?

슈

input_file_name()function then split+ regexp_extract(날짜 만 가져 오기)를 사용하여 file_name에서 날짜를 추출 하고 마지막 to_date으로 형식으로 날짜를 만듭니다 yyyy-MM-dd.

필터를 사용 date_sub(current_date(),21)하여 21 일 전 날짜를 가져옵니다.

Example:

from pyspark.sql.functions import *
#reading directory 
spark.read.parquet("wasbs://[email protected]/first_folder/").\
withColumn("date",\
    to_date(\
        regexp_extract(\
            split(input_file_name(),"-")[0]\
            ,"_(.*)",1),\
        "yyyy_MM_dd")).\
filter(col("date") > date_sub(current_date(),21)).\
show(10,False)

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-04-2

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

지난 21 일이 포함 된 파일 이름 읽기

지난 21 일이 포함 된 파일 이름 읽기

Heightmap이 포함 된 .raw 파일 읽기

Powershell 3.0 : 지난 24 시간 내 마지막 쓰기 시간이 포함 된 파일 이름 목록 반환

이름의 처음 몇 글자가 포함 된 Excel 파일 읽기

지정된 문자열을 포함하지 않는 파일 이름 찾기

변수 이름이 포함 된 파일 열기

문자열이 포함 된 파일 이름을 찾는 기능

문자열이 포함 된 파일 이름을 찾는 기능

파일에 여러 줄이 포함 된 한 줄에서 읽기

"["이 포함 된 파일 읽기에 대한 CONSTRAINT_ERROR

C # XML이 포함 된 텍스트 파일 읽기

숫자가 포함 된 파일 이름 찾기

파일 이름에 포함 된 날짜를 기준으로 파일 찾기

결과 데이터 프레임에 파일 이름이 포함 된 Spark 읽기 폴더 디렉터리

포함 된 파일 이름을 기반으로 zip 파일의 일괄 이름 바꾸기

SVG 파일에 포함 된 모든 이미지 뒤집기

포함 된 파일 내에서 "발신자"파일 이름 가져 오기

파일 내에 포함 된 문자열로 .txt 파일 이름 바꾸기

단일 열에 여러 값이 포함 된 Excel 파일 읽기 -Java

이름에 배치가 포함 된 경우 파일 이름 바꾸기

데이터 및 레이블이 포함 된 txt 파일을 tensorflow로 읽기

Ubuntu : Perl이 키릴 문자가 포함 된 파일 이름을 잘못 읽음

Ubuntu : Perl이 키릴 문자가 포함 된 파일 이름을 잘못 읽음

디렉토리에 사용자 이름 및 암호 인증이 포함 된 원격 PC에서 파일 읽기

bash를 사용하여 파일 이름이 포함 된 파일을 사용하여 여러 파일 만들기

달러 기호 ($)가 포함 된 파일 이름과 함께 find -exec 사용

공백이 포함 된 파일 이름으로 찾기가있는 셸 for 루프

쉼표가있는 문자열이 포함 된 .csv 파일 읽기 및 분할

SQLite : 파일 이름이 포함 된 열에서 확장자없이 파일 가져 오기

git : 지정된 개체 파일의 파일 이름 찾기