파이썬에서 다음 YAML 데이터를 구문 분석합니다.
>>> import yaml
>>> yaml.load("""
... ---
... categories: {1: Yes, 2: No}
... increasing: [00, 01, 02, 03, 04, 05, 06, 07, 08, 09, 10]
... ...
... """)
그리고 이것을 출력으로 얻으십시오.
{'increasing': [0, 1, 2, 3, 4, 5, 6, 7, '08', '09', 10], 'categories': {1: True, 2: False}}
에 대한 당신의 공제 00
에 07
자리, 잘립니다 올바르지 않습니다. 이들은 모두 8 진수 문자로, 선행 0
및 그 자체로 해석됩니다.
진수 문자는 포함 할 수 없습니다로 8
또는 와 아무것도하지만, 문자열 및 같은 당신의 YAML 파서로드를 할 수 없습니다.9
08
09
이것은 실제로 YAML 1.2의 YAML 1.1 에 남은 (역 호환성)입니다. 8 진수 는 다음으로 시작해야합니다.0o
그 Yes
와 No
같은로드 True
와 False
RESP. YAML-1.1-ishm이기도합니다. 1.2 사양은 더 이상 이러한 대안을 언급하지 않습니다. 해당 문자열을 인용하면 변환되지 않습니다.
다음 규칙을 추가하여 True / False에 대한 Yes / No / On / Off 변형을 허용하지 않는 리졸버를 비교적 쉽게 빌드 할 수 있습니다.
MyResolver.add_implicit_resolver(
u'tag:yaml.org,2002:bool',
re.compile(u'''^(?:true|True|TRUE|false|False|FALSE)$''', re.X),
list(u'tTfF'))
또는 일반을 사용하고 Resolver
적절한 시작 기호 항목을 삭제합니다.
import ruamel.yaml as yaml
from ruamel.yaml.resolver import Resolver
yaml_str = """\
categories: {1: Yes, 2: No}
"""
for ch in list(u'yYnNoO'):
del Resolver.yaml_implicit_resolvers[ch]
data = yaml.load(yaml_str, Loader=yaml.Loader)
print(data)
제공합니다 :
{'categories': {1: 'Yes', 2: 'No'}}
0으로 시작하는 모든 숫자 전용 문자열을 일반 정수로 인식하도록 만드는 것은 그렇게 간단하지 않습니다. 왜냐하면 암시 적 해석기를 변경하고 int
0으로 시작하는 문자열을 전달하면 구문 분석 문제가 발생하기 때문 08
입니다. 8 진수 ¹ :
import re
import ruamel.yaml as yaml
from ruamel.yaml.reader import Reader
from ruamel.yaml.resolver import BaseResolver, Resolver
from ruamel.yaml.scanner import RoundTripScanner
from ruamel.yaml.parser_ import Parser
from ruamel.yaml.composer import Composer
from ruamel.yaml.constructor import RoundTripConstructor
from ruamel.yaml import RoundTripLoader
from ruamel.yaml.compat import to_str
yaml_str = """\
categories: {1: Yes, 2: No}
increasing: [00, 01, 02, 03, 04, 05, 06, 07, 08, 09, 10]
"""
class MyResolver(BaseResolver):
pass
MyResolver.add_implicit_resolver(
u'tag:yaml.org,2002:bool',
re.compile(u'''^(?:true|True|TRUE|false|False|FALSE)$''', re.X),
list(u'tTfF'))
MyResolver.add_implicit_resolver(
u'tag:yaml.org,2002:float',
re.compile(u'''^(?:
[-+]?(?:[0-9][0-9_]*)\\.[0-9_]*(?:[eE][-+]?[0-9]+)?
|[-+]?(?:[0-9][0-9_]*)(?:[eE][-+]?[0-9]+)
|\\.[0-9_]+(?:[eE][-+][0-9]+)?
|[-+]?[0-9][0-9_]*(?::[0-5]?[0-9])+\\.[0-9_]*
|[-+]?\\.(?:inf|Inf|INF)
|\\.(?:nan|NaN|NAN))$''', re.X),
list(u'-+0123456789.'))
MyResolver.add_implicit_resolver(
u'tag:yaml.org,2002:int',
re.compile(u'''^(?:[-+]?0b[0-1_]+
|[-+]?[0-9]+
|[-+]?0o?[0-7_]+
|[-+]?(?:0|[1-9][0-9_]*)
|[-+]?0x[0-9a-fA-F_]+
|[-+]?[1-9][0-9_]*(?::[0-5]?[0-9])+)$''', re.X),
list(u'-+0123456789'))
MyResolver.add_implicit_resolver(
u'tag:yaml.org,2002:merge',
re.compile(u'^(?:<<)$'),
[u'<'])
MyResolver.add_implicit_resolver(
u'tag:yaml.org,2002:null',
re.compile(u'''^(?: ~
|null|Null|NULL
| )$''', re.X),
[u'~', u'n', u'N', u''])
MyResolver.add_implicit_resolver(
u'tag:yaml.org,2002:timestamp',
re.compile(u'''^(?:[0-9][0-9][0-9][0-9]-[0-9][0-9]-[0-9][0-9]
|[0-9][0-9][0-9][0-9] -[0-9][0-9]? -[0-9][0-9]?
(?:[Tt]|[ \\t]+)[0-9][0-9]?
:[0-9][0-9] :[0-9][0-9] (?:\\.[0-9]*)?
(?:[ \\t]*(?:Z|[-+][0-9][0-9]?(?::[0-9][0-9])?))?)$''', re.X),
list(u'0123456789'))
MyResolver.add_implicit_resolver(
u'tag:yaml.org,2002:value',
re.compile(u'^(?:=)$'),
[u'='])
# The following resolver is only for documentation purposes. It cannot work
# because plain scalars cannot start with '!', '&', or '*'.
MyResolver.add_implicit_resolver(
u'tag:yaml.org,2002:yaml',
re.compile(u'^(?:!|&|\\*)$'),
list(u'!&*'))
class MyRoundTripConstructor(RoundTripConstructor):
def construct_yaml_int(self, node):
value = to_str(self.construct_scalar(node))
value = value.replace('_', '')
sign = +1
if value[0] == '-':
sign = -1
if value[0] in '+-':
value = value[1:]
if value == '0':
return 0
elif value.startswith('0b'):
return sign*int(value[2:], 2)
elif value.startswith('0x'):
return sign*int(value[2:], 16)
elif value.startswith('0o'):
return sign*int(value[2:], 8)
#elif value[0] == '0':
# return sign*int(value, 8)
elif ':' in value:
digits = [int(part) for part in value.split(':')]
digits.reverse()
base = 1
value = 0
for digit in digits:
value += digit*base
base *= 60
return sign*value
else:
return sign*int(value)
MyRoundTripConstructor.add_constructor(
u'tag:yaml.org,2002:int',
MyRoundTripConstructor.construct_yaml_int)
class MyRoundTripLoader(Reader, RoundTripScanner, Parser,
Composer, MyRoundTripConstructor, MyResolver):
def __init__(self, stream):
Reader.__init__(self, stream)
RoundTripScanner.__init__(self)
Parser.__init__(self)
Composer.__init__(self)
MyRoundTripConstructor.__init__(self)
MyResolver.__init__(self)
for ch in list(u'yYnNoO'):
del Resolver.yaml_implicit_resolvers[ch]
data = yaml.load(yaml_str, Loader=MyRoundTripLoader)
print(data['increasing'])
그러면 다음과 같이 인쇄됩니다.
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
(또한 내부 조회 테이블에 인식 패턴을 먼저 삽입하지 않고 문자열로 예 / 아니오를 수행합니다.)
¹ 이를 위해 ruamel.yaml 을 사용 했으며 그 중 내가 저자입니다. ruamel.yaml의 기반이되는 PyYAML은 유사한 파생을 지원할 수 있어야합니다.
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다