'<'또는 '> 태그 옆에있는 문자열에서 유니 코드 기호를 대체하는 가장 빠른 방법이 필요합니다.
예를 들어, 입력 문자열 :
<एक्सएम्ेल type = "ए"> क्सएम् </एक्सएम्ेल>
예상 출력 :
<REPLACED type = "ए"> क्सएम् </REPLACED>`
태그 내부의 값 또는 유형 요소의 값은 대체하지 않아야하며 태그 이름 만 대체해야합니다.
이것은 내가 시도한 코드이며 작동하지 않습니다.
private static Regex _compiledUnicodeRegex = new Regex(@"<[^\u0000-\u007F]", RegexOptions.Compiled);
public static String StripUnicodeCharactersFromString(string inputValue)
{
return _compiledUnicodeRegex.Replace(inputValue, "REPLACED");
}
노트 -
비 ASCII 문자로 구성된 텍스트 줄을 <
또는 뒤에 만 바꾸고 싶은데 </
, 이것은 정규식으로 해결할 수 있는 문제입니다 .
당신은 사용할 수 있습니다
var result = Regex.Replace(text, @"(?<=</?)[^\x00-\x7F]+", "REPLACED");
.NET regex 데모를 참조하십시오 (무한 너비의 lookbehind 패턴을 허용 함).
정규식 일치
(?<=</?)
-(긍정적 인 lookbehind) <
또는 앞에 오는 문자열의 위치 </
(즉, <
뒤에 올 수도 있고 뒤 따르지 않을 수도 있음 /
)[^\x00-\x7F]+
-ASCII 세트에있는 문자가 아닌 1 개 이상의 문자.이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다