IUPath를 사용하여 PDF 파일의 특정 데이터를 정확하게 지정하려고합니다.
PDF의 데이터는 다음과 같습니다.
**** hjeprj3 **** 제임스 피쉬 **** JDR0929879 **** jdloin2 B5339 ||
"제임스 피쉬"라는 이름을 정확히 알아야합니다. 항상 같은 형식, 항상 **** 텍스트 **** 이름 성 **** 텍스트 그리고 항상 다른 이름을 추출해야합니다.
이 함수를 사용했습니다 : PDFText.Substring (PDFText.IndexOf ( "****", 0) +15,16) 이름이 항상 다르기 때문에 올바른 값을 반환하지 않습니다.
친절하게 조언 해 주시겠습니까?
도와 주셔서 감사합니다
@OP-모든 길이의 이름으로 작업 할 수 있도록 답변을 약간 조정합니다.
Strings.Trim(Strings.Split(PDFText.Substring(PDFText.IndexOf("**** ",0)+15,30),"*")(0))
여기에서 하위 문자열의 길이를 16에서 30으로 변경했는데, 대부분의 이름에 대해 충분히 길다고 생각합니다 (필요한 경우 길이 조정). 이것은 "James Fish **** JDR0929879 ***"를 반환하거나 1 ~ 2 개의 문자를 놓친 경우 이와 유사한 내용을 반환합니다.
구분 기호로 "*"를 사용하는 Strings.Split () 함수는이 하위 문자열을 여러 개의 다른 하위 문자열로 분할합니다.이 중 첫 번째 문자열은 인덱스 (0)에 있습니다.
그러면 Strings.Trim () 함수는 성 끝에있는 추가 공백을 제거합니다. 여기에 필요한 모든 것이 기술적으로 선호된다면 RTrim ()을 사용할 수 있습니다. Trim ()은 시작과 끝에서 공백을 제거합니다. 여기서 끝 부분 만 제거하면되지만 문자열에주의하는 것이 가장 좋습니다.
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다