UIPath에서 PDF로 데이터 추출

debugcn 에 게시 Dev

알렉스

IUPath를 사용하여 PDF 파일의 특정 데이터를 정확하게 지정하려고합니다.

PDF의 데이터는 다음과 같습니다.

**** hjeprj3 **** 제임스 피쉬 **** JDR0929879 **** jdloin2 B5339 ||

"제임스 피쉬"라는 이름을 정확히 알아야합니다. 항상 같은 형식, 항상 **** 텍스트 **** 이름 성 **** 텍스트 그리고 항상 다른 이름을 추출해야합니다.

이 함수를 사용했습니다 : PDFText.Substring (PDFText.IndexOf ( "****", 0) +15,16) 이름이 항상 다르기 때문에 올바른 값을 반환하지 않습니다.

친절하게 조언 해 주시겠습니까?

도와 주셔서 감사합니다

스페인

@OP-모든 길이의 이름으로 작업 할 수 있도록 답변을 약간 조정합니다.

Strings.Trim(Strings.Split(PDFText.Substring(PDFText.IndexOf("**** ",0)+15,30),"*")(0))

여기에서 하위 문자열의 길이를 16에서 30으로 변경했는데, 대부분의 이름에 대해 충분히 길다고 생각합니다 (필요한 경우 길이 조정). 이것은 "James Fish **** JDR0929879 ***"를 반환하거나 1 ~ 2 개의 문자를 놓친 경우 이와 유사한 내용을 반환합니다.

구분 기호로 "*"를 사용하는 Strings.Split () 함수는이 하위 문자열을 여러 개의 다른 하위 문자열로 분할합니다.이 중 첫 번째 문자열은 인덱스 (0)에 있습니다.

그러면 Strings.Trim () 함수는 성 끝에있는 추가 공백을 제거합니다. 여기에 필요한 모든 것이 기술적으로 선호된다면 RTrim ()을 사용할 수 있습니다. Trim ()은 시작과 끝에서 공백을 제거합니다. 여기서 끝 부분 만 제거하면되지만 문자열에주의하는 것이 가장 좋습니다.

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-04-1

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

UIPath에서 PDF로 데이터 추출

UIPath에서 PDF로 데이터 추출

Java에서 ODT에서 PDF로 데이터 추출

R로 pdf 파일에서 데이터 추출

VBA로 행에서 데이터 추출

PHP로 PDF에서 이미지 추출

Microsoft Word에서 데이터베이스 테이블로 데이터 추출

목록에서 데이터 프레임 열로 벡터 추출

Python에서 파일에서 파일로 데이터 추출

날씨 웹 사이트에서 VBA로 데이터 추출

Yahoo Finance에서 JSoup으로 테이블 데이터 추출

문서 또는 PDF에서 스프레드 시트로 데이터를 추출하는 가장 빠른 방법

Pandas df에서 목록으로 데이터 추출

Python으로 XML에서 데이터 읽기 / 추출

VBA-HTML에서 Excel로 데이터 추출

Node.js로 JSON에서 데이터 추출

목록에서 데이터 프레임으로 개체 추출

비 ARC 코드로 NSKeyedArchiver에서 데이터 추출

JSON 파일에서 CSV로 데이터 추출

RobotFramework로 HTML에서 숫자 데이터 추출

rss 파일에서 추출한 데이터를 simplexml로 수정

2 열 목록 상자에서 시트로 데이터 추출

.txt 파일에서 특정 패턴으로 데이터 추출

PHP로 CSV에서 데이터를 추출하는 방법

파일에서 다른 파일로 데이터 추출

로그 파일에서 데이터를 추출하는 방법

jquery로 div에서 데이터 값 추출

jquery로 div에서 데이터 값 추출

Excel 시트에서 다른 Excel 시트로 데이터 추출

Bash : 명령 줄 프로그램에서 데이터 추출

텍스트 파일에서 CSV로 데이터 추출