这,这,和这,并没有解决我的问题。他们都在制作自己的UDF。我想使用内置的UDF。任何内置的UDF。我尝试过的每个UDF都会收到相同或相似的错误。
FOO = LOAD 'filepath/data.csv'
USING PigStorage(',')
AS (name:string, age:int, kilograms:double);
BAR = FOREACH FOO GENERATE $0, $1, $2, kilograms*2.2 AS pounds;
这可以按预期工作,基本上创建与FOO相同的关系,但有一个将KG转换为LBS的额外列。
但是,如果我想使用类似的方法来获取公斤的对数刻度,则如下所示:
BAR2 = FOREACH FOO GENERATE $0, $1, $2, log(kilograms) AS logscaleKG;
我收到以下错误(或类似错误):
ERROR org.apache.pig.tools.grunt.Grunt - ERROR 1070: Could not resolve log using imports: [, java.lang., org.apache.pig.builtin., org.apache.pig.impl.builtin.]
在FOREACH GENERATE内部似乎没有UDF起作用。
猪对大小写有点挑剔,需要大写log
。例如,我可以在新的Hortonworks Sandbox上很好地运行此代码。
$ hdfs dfs -cat /tmp/kg.csv
one,1
two,2
three,3
+
grunt> a = LOAD '/tmp/kg.csv' USING PigStorage(',') AS (txt:chararray, val:int);
grunt> b = FOREACH a GENERATE txt, val, LOG(val);
grunt> DUMP b;
... # Running some MapReduces
(one,1,0.0)
(two,2,0.6931471805599453)
(three,3,1.0986122886681098)
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句