pytesseract를 사용하여 이미지의 특정 부분에서 텍스트를 추출 할 수 있습니까?

debugcn 에 게시 Dev

프렘 쿠마르 P

이미지에 경계 상자 (사각형 좌표)가 있고 해당 좌표 내에서 텍스트를 추출하고 싶습니다. pytesseract를 사용하여 해당 좌표 내에서 텍스트를 추출하려면 어떻게해야합니까?

나는 opencv를 사용하여 이미지 부분을 다른 numpyarray에 복사하려고했습니다.

cropped_image = image[y1:y2][x1:x2]

그리고 pytesseract.image_to_string ()을 시도했습니다. 그러나 정확도는 매우 낮았습니다. 그러나 원본 이미지를 pytesseract.image_to_string ()에 시도했을 때 모든 것을 완벽하게 추출했습니다 ..

pytesseract를 사용하여 이미지의 특정 부분을 추출하는 기능이 있습니까?

이 이미지에는 정보의 다른 섹션이 있습니다. '온라인 음식 배달 시스템'을 둘러싸는 직사각형 좌표가 있다고 생각하면 피 테사 랙트에서 해당 데이터를 추출하는 방법은 무엇입니까?

미리 감사드립니다.

내가 사용중인 버전 : Tesseract 4.0.0 pytesseract 0.3.0 OpenCv 3.4.3

나단시

Pytesseract를 사용하여 이미지의 특정 부분을 추출하는 기능은 내장되어 있지 않지만 OpenCV를 사용하여 ROI 경계 상자를 추출한 다음이 ROI를 Pytesseract에 넣을 수 있습니다. 이미지를 회색조로 변환 한 다음 임계 값을 사용하여 이진 이미지를 얻습니다. 원하는 ROI 좌표가 있다고 가정하면 Numpy 슬라이싱을 사용하여 원하는 ROI를 추출합니다.

여기에서 우리는 결과를 얻기 위해 그것을 Pytesseract에 던집니다.

ONLINE FOOD DELIVERY SYSTEM

암호

import cv2
import pytesseract

pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"

image = cv2.imread('1.jpg', 0)
thresh = 255 - cv2.threshold(image, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]

x,y,w,h = 37, 625, 309, 28  
ROI = thresh[y:y+h,x:x+w]
data = pytesseract.image_to_string(ROI, lang='eng',config='--psm 6')
print(data)

cv2.imshow('thresh', thresh)
cv2.imshow('ROI', ROI)
cv2.waitKey()

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-04-1

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

pytesseract를 사용하여 이미지의 특정 부분에서 텍스트를 추출 할 수 있습니까?

pytesseract를 사용하여 이미지의 특정 부분에서 텍스트를 추출 할 수 있습니까?

파이썬에서 정규식을 사용하여 "----"로 구분 된 텍스트의 특수 부분을 어떻게 추출 할 수 있습니까?

Python의 Beautiful Soup을 사용하여 특정 span 태그에서 텍스트를 추출 할 수 없습니다.

파이썬에서 pytesseract를 사용하여 tif 이미지에서 텍스트를 추출 할 수 없습니다.

pytesseract를 사용하여 이미지의 특정 좌표에서 텍스트를 추출하는 방법은 무엇입니까?

비디오 파일의 특정 부분에서 오디오를 추출 / 복사 할 수 있습니까?

Javascript를 사용하여 pdf에서 텍스트의 특정 부분을 추출 하시겠습니까?

pytesseract.image_to_string이 이미지에서 텍스트를 추출 할 수없는 것 같습니다.

php 또는 javascript를 사용하여 PDF 파일에서 텍스트와 이미지를 어떻게 추출 할 수 있습니까?

iMacros를 사용하여 특정 웹 사이트의 텍스트 상자에서 텍스트를 추출 할 수 없음

텍스트 파일에서 모든 줄의 특정 부분을 어떻게 추출 할 수 있습니까?

정규식을 사용하여 일부 텍스트에서 두 필드를 추출 할 수 없습니다.

특정 PDF에서 텍스트와 이미지를 추출 할 수 없습니다.

"호스트"파일을 사용하여 특정 URL의 이미지를 차단할 수 있습니까?

이미지와 표 사이에 텍스트를 정렬 할 수 있습니까?

jquery 또는 javascript를 사용하여 행의 특정 td에 데이터를 추가 할 수 있습니까?

rvest를 사용하여 R에서 Wikipedia 테이블의 특정 요소를 어떻게 추출 할 수 있습니까?

Xpath를 사용하여 srcset에서 이미지 1 개를 어떻게 추출 할 수 있습니까?

특정 텍스트를 사용하여 Android에서 Autocomplete TextView를로드 할 수 있습니까?

Java에서 정규식 또는 하위 문자열을 사용하여 문자열에서 텍스트를 어떻게 추출 할 수 있습니까?

텍스트 줄에서 정수를 어떻게 추출 할 수 있습니까?

re2 정규식을 사용하여 단일 마침표 사이의 모든 텍스트를 어떻게 추출 할 수 있습니까 (예 :`...`무시)?

PHP를 사용하여 다른 배열에서 특정 데이터를 어떻게 추출 할 수 있습니까?

geograpy를 사용하여 텍스트에서 국가 이름 'UK'를 추출 할 수 없습니다.

pytorch 텐서의 특정 키에 해당하는 모든 인덱스를 추출 할 수 있습니까?

변수를 사용하여 perl에서 특정 네임 스페이스를 설정할 수 있습니까?

파이썬을 사용하여 바이트 파일에서 텍스트를 어떻게 추출 할 수 있습니까?

Excel에서 와일드 카드를 사용하여 셀에 특정 텍스트가 포함되어 있는지 확인할 수 있습니까?

사용자 에이전트의 일부를 추출하여 표시 할 수 있습니까?

Excel 차트 : 차트의 막대에 특정 텍스트를 추가 할 수 있습니까?