문자열에서 특정 문자의 범위 찾기

debugcn 에 게시 Dev

user3015703

Windows 7에서 python-3.x로 작업하고 있습니다. 수백만 개의 문자로 구성된 문자열이 있습니다. 예를 들어 :

ATCGNNNATCGATNNNNNATCGANTCG

나는 범위를 얻고 싶다 N. 여기에서 [[4,7], [13,18], [23,24]]. N방대한 데이터이고이 방법이 너무 느리기 때문에 s의 위치를 취한 다음 범위로 변환 할 수는 없습니다. 그렇게 쉬운 문제처럼 보이지만 실제로는 좋은 방법이 떠오르지 않습니다. 이를 수행하는 빠른 방법이 있습니까?

tobias_k

이것이 수백만 개의 문자열로 어떻게 확장되는지 확실하지 않지만 정규 표현식을 시도해 볼 수 있습니다 .

>>> import re
>>> data = "ATCGNNNATCGATNNNNNATCGANTCG"
>>> spans = (g.span() for g in re.finditer('N+', data))
>>> list(spans)
[(4, 7), (13, 18), (23, 24)]

업데이트 : A, C, G, T 및 N의 무작위로 생성 된 문자열로 이것을 시도했습니다. 1,000,000 자의 list(spans)경우 1 초 미만이 걸리고 10,000,000의 경우 완전히 새로운 컴퓨터에서 약 10 초가 걸립니다. 약 1,600,000 개의 N 그룹.

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-06-1

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

문자열에서 특정 문자의 범위 찾기

문자열에서 특정 문자의 범위 찾기

문자열 Swift 3에서 특정 범위의 문자 얻기

Postgres의 문자열에서 특정 문자의 n 번째 위치 찾기

셀 범위에서 문자열 찾기

특정 문자를 건너 뛰면서 문자열에서 위치 찾기

MySQL 필드 내에서 특정 하위 문자열 찾기

Java에서 특정 길이 / 형식의 하위 문자열 찾기

하위 디렉터리 내의 특정 파일에서만 문자열 찾기

문자열에서 특정 문자 집합 뒤의 값 찾기

문자열 범위 찾기

범위 문자열에서 숫자가 속한 범위 찾기

특정 위치의 문자열에서 값 가져 오기

문자열의 특정 위치에서 특정 문자 교체

Excel : 열의 문자열에서 특정 단어의 각 발생 위치 / 위치 찾기

문자열에서 특정 패턴을 찾기위한 정규식

id 문자열에 특정 문자열이 포함 된 위치 찾기

문자열의 특정 위치에서 하나의 일치 만 찾습니다.

df 열 R의 특정 문자 바꾸기 (하위 문자열)

특정 문자열의 인스턴스와 다음 문자열의 처음 2 자 찾기 및 PHP에서 위치 전환

PHP의 문자열을 기반으로 범위에서 고정 난수 생성

해당 파일의 특정 위치에서 파일의 마지막 문자열 찾기

Pyspark에서 특정 위치 뒤의 하위 문자열 위치 가져 오기

문자열에서 특정 문자 찾기

긴 문자열에서 특정 하위 문자열 가져 오기

배열 값에서 특정 문자의 발생 찾기

지정된 문자열에서 지정된 부분 문자열의 위치 찾기 (MATLAB)

특정 위치의 문자열에서 문자 제거

시작 인덱스가 지정된 문자열에서 하위 문자열의 인덱스 찾기

시작 인덱스가 지정된 문자열에서 하위 문자열의 인덱스 찾기

파이썬에서 파일의 특정 위치에 문자열 쓰기