当我从https://www1.ncdc.noaa.gov/pub/data/uscrn/products/subhourly01/2017/CRNS0101-05-2017-TX_Austin_33_NW.txt导出公共天气数据时,只要太阳辐射 > 9,所有其余列的数据集中在一个列中,如下所示。我试过上传为 txt 和 csv,但问题仍然存在于 excel、sheets 和 dataprep 中。
为什么会这样?
是否有一种编程方式来解决这个问题,以便数据按预期填充,每列有 1 个值?
可能是因为未正确检测到初始数据结构。如果数据集的第一行与其余行的结构不同,就会发生这种情况。
要在 Dataprep 中解决此问题,您可以通过以下步骤指示应如何构建数据集:
splitrows col: column1 on: '\n'
/\s+/
)
splitpatterns col: column1 type: on on: /\s+/ limit: 22
(您可以在创建新步骤时将以下命令复制并粘贴到搜索输入中)
注意:还可以在导入数据集时阻止初始结构检测。请参阅https://cloud.google.com/dataprep/docs/html/Remove-Initial-Structure_136154971
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句