我正在尝试对具有以下输入法格式的记录的文本文件进行排序:
b1 xy
a2 pq
这是我的pySpark代码:
distFile = sc.textFile(input.txt)
words = distFile.map(lambda x: [x[:2],x[2:]])
words.saveAsTextFile("output")
这就是我作为输出内容所得到的
输出/ part-00000
[u'a2', u'pq']
[u'b1', u'xy']
我想要的内容是:
a2 pq
b1 xy
我究竟做错了什么?
当我使用时我也会得到垃圾值 words.saveAsPickleFile("output")
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句