ApachePig-コマンドエラーを説明する

]$ cat webccess.txt
mark,yahoo.com,6
sam,google.com,7
john,yahoo.com,3
patrick,cnn.com,8
mary,facebook.com,1
mark,yahoo.com,4
john,bbc.com,10
andrew,twitter.com,3
patrick,twitter.com,9

Cloudera Quick Vm Hue-Pig Shell(Grunt)で以下のタスクを実行しています

grunt> stage1 = LOAD '/user/cloudera/webaccess.txt' USING PigStorage(',') AS (name:chararray, website:chararray, access:int);
grunt> DUMP stage1;
grunt> stage2 = FILTER stage1 by access >= 8;
grunt> stage3 = GROUP stage1 by name;
grunt> stage4 = FOREACH stage3 GENERATE group as GROUPS, MAX(stage1.access);
grunt> DUMP stage4;

出力:

(sam,7)
(john,10)
(mark,6)
(mary,1)
(andrew,3)
(patrick,9)

これまではすべて問題ありません。

ILLUSTRATEコマンドを適用してリレーションstage4を確認すると、次のようなエラーが発生します。

grunt> ILLUSTRATE stage4;

2014-10-07 04:02:43,639 [main] WARN org.apache.hadoop.conf.Configuration - fs.default.name is deprecated. Instead, use fs.defaultFS
2014-10-07 04:02:43,642 [main] INFO org.apache.pig.backend.hadoop.executionengine.HExecutionEngine - Connecting to hadoop file system at: hdfs://localhost.localdomain:8020
2014-10-07 04:02:43,643 [main] WARN org.apache.hadoop.conf.Configuration - io.bytes.per.checksum is deprecated. Instead, use dfs.bytes-per-checksum
2014-10-07 04:02:43,643 [main] WARN org.apache.hadoop.conf.Configuration - dfs.https.address is deprecated. Instead, use dfs.namenode.https-address
2014-10-07 04:02:43,643 [main] INFO org.apache.pig.backend.hadoop.executionengine.HExecutionEngine - Connecting to map-reduce job tracker at: localhost.localdomain:8021
2014-10-07 04:02:43,799 [main] INFO org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MRCompiler - File concatenation threshold: 100 optimistic? false
2014-10-07 04:02:43,800 [main] INFO org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MultiQueryOptimizer - MR plan size before optimization: 1
2014-10-07 04:02:43,800 [main] INFO org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MultiQueryOptimizer - MR plan size after optimization: 1
2014-10-07 04:02:43,804 [main] INFO org.apache.pig.tools.pigstats.ScriptState - Pig script settings are added to the job
2014-10-07 04:02:43,805 [main] ERROR org.apache.pig.pen.ExampleGenerator - Error reading data. Internal error creating job configuration.
java.lang.RuntimeException: Internal error creating job configuration.
at org.apache.pig.pen.ExampleGenerator.getExamples(ExampleGenerator.java:160)
at org.apache.pig.PigServer.getExamples(PigServer.java:1182)
at org.apache.pig.tools.grunt.GruntParser.processIllustrate(GruntParser.java:739)
at org.apache.pig.tools.pigscript.parser.PigScriptParser.Illustrate(PigScriptParser.java:626)
at org.apache.pig.tools.pigscript.parser.PigScriptParser.parse(PigScriptParser.java:323)
at org.apache.pig.tools.grunt.GruntParser.parseStopOnError(GruntParser.java:194)
at org.apache.pig.tools.grunt.GruntParser.parseStopOnError(GruntParser.java:170)
at org.apache.pig.tools.grunt.Grunt.run(Grunt.java:69)
at org.apache.pig.Main.run(Main.java:538)
at org.apache.pig.Main.main(Main.java:157)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
at java.lang.reflect.Method.invoke(Method.java:597)
at org.apache.hadoop.util.RunJar.main(RunJar.java:208)
2014-10-07 04:02:43,868 [main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 2997: Encountered IOException. Exception
Details at logfile: /dev/null

このエラーのため、私は学習段階にあり、次のトピックに進むことができませんでした。

また、このタスクを最初に開始する前に、Hue-Pig Shell(Grunt)を開いたときに、次の警告が見つかりました。

Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/hadoop/util/PlatformName
Caused by: java.lang.ClassNotFoundException: org.apache.hadoop.util.PlatformName
at java.net.URLClassLoader$1.run(URLClassLoader.java:202)
at java.security.AccessController.doPrivileged(Native Method)
at java.net.URLClassLoader.findClass(URLClassLoader.java:190)
at java.lang.ClassLoader.loadClass(ClassLoader.java:306)
at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:301)
at java.lang.ClassLoader.loadClass(ClassLoader.java:247)
Could not find the main class: org.apache.hadoop.util.PlatformName. Program will exit.
which: no hadoop in ((null))
which: no /usr/lib/hadoop/bin/hadoop in ((null))
dirname: missing operand
Try `dirname --help' for more information.
2014-10-07 03:18:27,802 [main] INFO org.apache.pig.Main - Apache Pig version 0.11.0-cdh4.7.0 (rexported) compiled May 28 2014, 11:05:48
2014-10-07 03:18:27,803 [main] INFO org.apache.pig.Main - Logging error messages to: /dev/null
2014-10-07 03:18:28,758 [main] INFO org.apache.pig.impl.util.Utils - Default bootup file /home/cloudera/.pigbootup not found
2014-10-07 03:18:30,436 [main] WARN org.apache.hadoop.conf.Configuration - fs.default.name is deprecated. Instead, use fs.defaultFS
2014-10-07 03:18:30,444 [main] INFO org.apache.pig.backend.hadoop.executionengine.HExecutionEngine - Connecting to hadoop file system at: hdfs://localhost.localdomain:8020
2014-10-07 03:18:37,832 [main] INFO org.apache.pig.backend.hadoop.executionengine.HExecutionEngine - Connecting to map-reduce job tracker at: localhost.localdomain:8021
2014-10-07 03:18:37,842 [main] WARN org.apache.hadoop.conf.Configuration - fs.default.name is deprecated. Instead, use fs.defaultFS
Sivasakthi jayaraman

問題は発生しませんでした。コマンドが正常に機能していることを示しています。最初にローカルモードで実行してみてください。

    $pig -x local
    grunt> stage1 = LOAD 'input.txt' USING PigStorage(',') AS (name:chararray, website:chararray, access:int);
    grunt> stage2 = FILTER stage1 by access >= 8;
    grunt> stage3 = GROUP stage1 by name;
    grunt> stage4 = FOREACH stage3 GENERATE group as GROUPS, MAX(stage1.access);
    grunt> DUMP stage4;
    (sam,7)
    (john,10)
    (mark,6)
    (mary,1)
    (andrew,3)
    (patrick,9)
    grunt> ILLUSTRATE stage4;
    ----------------------------------------------------------------------------
    | stage1     | name:chararray     | website:chararray     | access:int     | 
    ----------------------------------------------------------------------------
    |            | john               | yahoo.com             | 3              | 
    |            | john               | bbc.com               | 10             | 
    ----------------------------------------------------------------------------
    --------------------------------------------------------------------------------------------------------------------------
    | stage3     | group:chararray     | stage1:bag{:tuple(name:chararray,website:chararray,access:int)}                     | 
    --------------------------------------------------------------------------------------------------------------------------
    |            | john                | {(john, yahoo.com, 3), (john, bbc.com, 10)}                                         | 
    |            | john                | {(john, yahoo.com, 3), (john, bbc.com, 10)}                                         | 
    --------------------------------------------------------------------------------------------------------------------------
    ------------------------------------------------
    | stage4     | GROUPS:chararray     | :int     | 
    ------------------------------------------------
    |            | john                 | 10       | 
    ------------------------------------------------

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

ApachePigエスケープ列名

分類Dev

ApachepigでSimpleRandomSampleを使用する方法

分類Dev

ApachePigランク関数の使用法

分類Dev

ApachePigとユーザー定義関数

分類Dev

ApachePig浮動小数点のSUMエラーの精度

分類Dev

Hadoop2.4バージョン用のApachePigのビルド

分類Dev

ApachePigで文字列の最初の部分を抽出する正規表現

分類Dev

ApachePigラテン語での月の名前

分類Dev

ApachePigを使用した日付のフィルタリング

分類Dev

ApachePigエラー-chararrayのすべての列を受け入れない理由

分類Dev

ApachePigのNタプルごとの平均値を取得します

分類Dev

タイムスタンプから現在までのApachePig

分類Dev

ApachePig-複数の一致基準を持つ一致

分類Dev

ApachePigでオブジェクトを結合した後のエラー

分類Dev

ApachePigの例で演算子の使用法を明確にします

分類Dev

JSON列をApachePIGのフィールドとして読み取る方法

分類Dev

フィルタリングされた値をカウントする-ApachePIG

分類Dev

apachepigを使用して非構造化データを構造化する方法

分類Dev

次のApachePigエラーを解決するにはどうすればよいですか?

分類Dev

Apachepigを使用してディレクトリを再帰的に一覧表示する

分類Dev

区切られていないasciifファイルを読むApachePig Latin

分類Dev

ApachePIGバッグのようなPythonデータフレームのエントリをフラット化する

分類Dev

ApachePigで定義されたスキーマに従って出力を取得しない

分類Dev

ApachePigを使用してGROUPBYのようなSQLを取得するにはどうすればよいですか?

分類Dev

DateTimeを時間またはダンプ結果でグループ化できないApachePig

分類Dev

関数ごとのApachepigグループが期待される出力を提供していない

分類Dev

Pythonスクリプトで、スタンドアロンの単体テストでApachePigのPythonデコレータを無視するにはどうすればよいですか。

分類Dev

コマンドを説明する

分類Dev

コマンドラインを使用してPHPにエラーの概要を説明させる

Related 関連記事

  1. 1

    ApachePigエスケープ列名

  2. 2

    ApachepigでSimpleRandomSampleを使用する方法

  3. 3

    ApachePigランク関数の使用法

  4. 4

    ApachePigとユーザー定義関数

  5. 5

    ApachePig浮動小数点のSUMエラーの精度

  6. 6

    Hadoop2.4バージョン用のApachePigのビルド

  7. 7

    ApachePigで文字列の最初の部分を抽出する正規表現

  8. 8

    ApachePigラテン語での月の名前

  9. 9

    ApachePigを使用した日付のフィルタリング

  10. 10

    ApachePigエラー-chararrayのすべての列を受け入れない理由

  11. 11

    ApachePigのNタプルごとの平均値を取得します

  12. 12

    タイムスタンプから現在までのApachePig

  13. 13

    ApachePig-複数の一致基準を持つ一致

  14. 14

    ApachePigでオブジェクトを結合した後のエラー

  15. 15

    ApachePigの例で演算子の使用法を明確にします

  16. 16

    JSON列をApachePIGのフィールドとして読み取る方法

  17. 17

    フィルタリングされた値をカウントする-ApachePIG

  18. 18

    apachepigを使用して非構造化データを構造化する方法

  19. 19

    次のApachePigエラーを解決するにはどうすればよいですか?

  20. 20

    Apachepigを使用してディレクトリを再帰的に一覧表示する

  21. 21

    区切られていないasciifファイルを読むApachePig Latin

  22. 22

    ApachePIGバッグのようなPythonデータフレームのエントリをフラット化する

  23. 23

    ApachePigで定義されたスキーマに従って出力を取得しない

  24. 24

    ApachePigを使用してGROUPBYのようなSQLを取得するにはどうすればよいですか?

  25. 25

    DateTimeを時間またはダンプ結果でグループ化できないApachePig

  26. 26

    関数ごとのApachepigグループが期待される出力を提供していない

  27. 27

    Pythonスクリプトで、スタンドアロンの単体テストでApachePigのPythonデコレータを無視するにはどうすればよいですか。

  28. 28

    コマンドを説明する

  29. 29

    コマンドラインを使用してPHPにエラーの概要を説明させる

ホットタグ

アーカイブ