我正在开发一个从CSV文件导入数据的应用程序。有人告诉我CSV文件中的数据来自SAP,我完全不熟悉。
我的客户指出存在问题。CSV文件中的一列数据包含邮政地址。有时,系统看不到有效地址。这是一个虚构的示例:
1234 MAIN ST A&#C HOUSTON
如您所见,有一个街道号,一个街道名和一个城市,全部用大写字母表示。没有指定状态或邮政编码。在CSV文件中,假定所有地址都处于相同状态。
通常,在街道名称和城市之间有文字的地方,它是公寓号码或字母。在上面的示例中,当我们尝试将地址与其他服务(例如Google地理位置)一起使用时,会出错。建议的解决方法是仅在其中删除特殊字符,但我认为必须有更好的方法。
我想知道这A&#C
是什么意思。它看起来像某种转义序列,但不是我所熟悉的格式。请告诉我这些奇怪的字符序列的含义。
我不太确定,但是我怀疑是否有一个像这样的“规范”转义序列。在ABAP环境中,#
用于替换不可打印的字符。最初将数据导入到SAP系统中时可能会对数据进行不正确的清理,并且在写入输出文件时,某些不可打印的字符将替换为#
。另一种解释可能是该领域的一个包含非ASCII Unicode字符(如,)和出口程序未能将其转换成所选择的目标代码页。不检查实际的源数据集就很难分辨。当然,这也可能是一些编程错误或怪异的自定义字段分隔符...
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句