次のApachePigエラーを解決するにはどうすればよいですか?

datavinci

次のコマンドを実行しています。

A= load 'user/cloudera' using PigStorage(':');
foreach A generate $0,$4,$5;
dump B;

最後のコマンドを実行すると、解決できない次のエラーが発生します.bigdataとapache hadoopスタックの初心者であるため、このエラーを理解できません。できるだけ早く助けてください。同様のエラーをStackOverflowで検索しても役に立ちませんでした:

2015-11-13 06:36:46,170 [main] INFO  org.apache.pig.tools.pigstats.ScriptState - Pig features used in the script: UNKNOWN
2015-11-13 06:36:46,208 [main] INFO  org.apache.pig.newplan.logical.optimizer.LogicalPlanOptimizer - {RULES_ENABLED=[AddForEach, ColumnMapKeyPrune, DuplicateForEachColumnRewrite, GroupByConstParallelSetter, ImplicitSplitInserter, LimitOptimizer, LoadTypeCastInserter, MergeFilter, MergeForEach, NewPartitionFilterOptimizer, PushDownForEachFlatten, PushUpFilter, SplitFilter, StreamTypeCastInserter], RULES_DISABLED=[FilterLogicExpressionSimplifier, PartitionFilterOptimizer]}
2015-11-13 06:36:46,212 [main] INFO  org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MRCompiler - File concatenation threshold: 100 optimistic? false
2015-11-13 06:36:46,225 [main] INFO  org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MultiQueryOptimizer - MR plan size before optimization: 1
2015-11-13 06:36:46,225 [main] INFO  org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MultiQueryOptimizer - MR plan size after optimization: 1
2015-11-13 06:36:46,404 [main] INFO  org.apache.hadoop.yarn.client.RMProxy - Connecting to ResourceManager at /0.0.0.0:8032
2015-11-13 06:36:46,415 [main] INFO  org.apache.pig.tools.pigstats.ScriptState - Pig script settings are added to the job
2015-11-13 06:36:46,445 [main] INFO  org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.JobControlCompiler - mapred.job.reduce.markreset.buffer.percent is not set, set to default 0.3
2015-11-13 06:36:49,232 [main] INFO  org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.JobControlCompiler - creating jar file Job306801006066349255.jar
2015-11-13 06:37:04,185 [main] INFO  org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.JobControlCompiler - jar file Job306801006066349255.jar created
2015-11-13 06:37:04,223 [main] INFO  org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.JobControlCompiler - Setting up single store job
2015-11-13 06:37:04,238 [main] INFO  org.apache.pig.data.SchemaTupleFrontend - Key [pig.schematuple] is false, will not generate code.
2015-11-13 06:37:04,238 [main] INFO  org.apache.pig.data.SchemaTupleFrontend - Starting process to move generated code to distributed cache
2015-11-13 06:37:04,238 [main] INFO  org.apache.pig.data.SchemaTupleFrontend - Setting key [pig.schematuple.classes] with classes to deserialize []
2015-11-13 06:37:04,274 [main] INFO  org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLauncher - 1 map-reduce job(s) waiting for submission.
2015-11-13 06:37:04,274 [main] INFO  org.apache.hadoop.conf.Configuration.deprecation - mapred.job.tracker is deprecated. Instead, use mapreduce.jobtracker.address
2015-11-13 06:37:04,283 [JobControl] INFO  org.apache.hadoop.yarn.client.RMProxy - Connecting to ResourceManager at /0.0.0.0:8032
2015-11-13 06:37:04,363 [JobControl] INFO  org.apache.hadoop.conf.Configuration.deprecation - fs.default.name is deprecated. Instead, use fs.defaultFS
2015-11-13 06:37:05,416 [JobControl] INFO  org.apache.hadoop.mapreduce.JobSubmitter - Cleaning up the staging area /tmp/hadoop-yarn/staging/cloudera/.staging/job_1447417089361_0004
2015-11-13 06:37:05,420 [JobControl] WARN  org.apache.hadoop.security.UserGroupInformation - PriviledgedActionException as:cloudera (auth:SIMPLE) cause:org.apache.pig.backend.executionengine.ExecException: ERROR 2118: Input path does not exist: hdfs://quickstart.cloudera:8020/user/cloudera/user/cloudera
2015-11-13 06:37:05,420 [JobControl] INFO  org.apache.hadoop.mapreduce.lib.jobcontrol.ControlledJob - PigLatin:DefaultJobName got an error while submitting 
org.apache.pig.backend.executionengine.ExecException: ERROR 2118: Input path does not exist: hdfs://quickstart.cloudera:8020/user/cloudera/user/cloudera
    at org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.PigInputFormat.getSplits(PigInputFormat.java:288)
    at org.apache.hadoop.mapreduce.JobSubmitter.writeNewSplits(JobSubmitter.java:597)
    at org.apache.hadoop.mapreduce.JobSubmitter.writeSplits(JobSubmitter.java:614)
    at org.apache.hadoop.mapreduce.JobSubmitter.submitJobInternal(JobSubmitter.java:492)
    at org.apache.hadoop.mapreduce.Job$10.run(Job.java:1306)
    at org.apache.hadoop.mapreduce.Job$10.run(Job.java:1303)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:415)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1671)
    at org.apache.hadoop.mapreduce.Job.submit(Job.java:1303)
    at org.apache.hadoop.mapreduce.lib.jobcontrol.ControlledJob.submit(ControlledJob.java:335)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:606)
    at org.apache.pig.backend.hadoop23.PigJobControl.submit(PigJobControl.java:128)
    at org.apache.pig.backend.hadoop23.PigJobControl.run(PigJobControl.java:191)
    at java.lang.Thread.run(Thread.java:745)
    at org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLauncher$1.run(MapReduceLauncher.java:270)
Caused by: org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist: hdfs://quickstart.cloudera:8020/user/cloudera/user/cloudera
    at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.singleThreadedListStatus(FileInputFormat.java:321)
    at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.listStatus(FileInputFormat.java:264)
    at org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.PigTextInputFormat.listStatus(PigTextInputFormat.java:36)
    at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.getSplits(FileInputFormat.java:385)
    at org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.PigInputFormat.getSplits(PigInputFormat.java:274)
    ... 18 more
2015-11-13 06:37:05,423 [main] INFO  org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLauncher - HadoopJobId: job_1447417089361_0004
2015-11-13 06:37:05,423 [main] INFO  org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLauncher - Processing aliases A,B
2015-11-13 06:37:05,423 [main] INFO  org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLauncher - detailed locations: M: A[3,3],B[4,3] C:  R: 
2015-11-13 06:37:05,423 [main] INFO  org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLauncher - More information at: http://localhost:50030/jobdetails.jsp?jobid=job_1447417089361_0004
2015-11-13 06:37:05,440 [main] INFO  org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLauncher - 0% complete
2015-11-13 06:37:10,463 [main] WARN  org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLauncher - Ooops! Some job has failed! Specify -stop_on_failure if you want Pig to stop immediately on failure.
2015-11-13 06:37:10,463 [main] INFO  org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLauncher - job job_1447417089361_0004 has failed! Stop running all dependent jobs
2015-11-13 06:37:10,463 [main] INFO  org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLauncher - 100% complete
2015-11-13 06:37:10,620 [main] INFO  org.apache.hadoop.mapred.ClientServiceDelegate - Could not get Job info from RM for job job_1447417089361_0004. Redirecting to job history server.
2015-11-13 06:37:10,844 [main] INFO  org.apache.hadoop.mapred.ClientServiceDelegate - Could not get Job info from RM for job job_1447417089361_0004. Redirecting to job history server.
2015-11-13 06:37:10,849 [main] ERROR org.apache.pig.tools.pigstats.PigStatsUtil - 1 map reduce job(s) failed!
2015-11-13 06:37:10,850 [main] INFO  org.apache.pig.tools.pigstats.SimplePigStats - Script Statistics: 

HadoopVersion   PigVersion  UserId  StartedAt   FinishedAt  Features
2.6.0-cdh5.4.2  0.12.0-cdh5.4.2 cloudera    2015-11-13 06:36:46 2015-11-13 06:37:10 UNKNOWN

Failed!

Failed Jobs:
JobId   Alias   Feature Message Outputs
job_1447417089361_0004  A,B MAP_ONLY    Message: org.apache.pig.backend.executionengine.ExecException: ERROR 2118: Input path does not exist: hdfs://quickstart.cloudera:8020/user/cloudera/user/cloudera
    at org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.PigInputFormat.getSplits(PigInputFormat.java:288)
    at org.apache.hadoop.mapreduce.JobSubmitter.writeNewSplits(JobSubmitter.java:597)
    at org.apache.hadoop.mapreduce.JobSubmitter.writeSplits(JobSubmitter.java:614)
    at org.apache.hadoop.mapreduce.JobSubmitter.submitJobInternal(JobSubmitter.java:492)
    at org.apache.hadoop.mapreduce.Job$10.run(Job.java:1306)
    at org.apache.hadoop.mapreduce.Job$10.run(Job.java:1303)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:415)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1671)
    at org.apache.hadoop.mapreduce.Job.submit(Job.java:1303)
    at org.apache.hadoop.mapreduce.lib.jobcontrol.ControlledJob.submit(ControlledJob.java:335)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:606)
    at org.apache.pig.backend.hadoop23.PigJobControl.submit(PigJobControl.java:128)
    at org.apache.pig.backend.hadoop23.PigJobControl.run(PigJobControl.java:191)
    at java.lang.Thread.run(Thread.java:745)
    at org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLauncher$1.run(MapReduceLauncher.java:270)
Caused by: org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist: hdfs://quickstart.cloudera:8020/user/cloudera/user/cloudera
    at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.singleThreadedListStatus(FileInputFormat.java:321)
    at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.listStatus(FileInputFormat.java:264)
    at org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.PigTextInputFormat.listStatus(PigTextInputFormat.java:36)
    at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.getSplits(FileInputFormat.java:385)
    at org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.PigInputFormat.getSplits(PigInputFormat.java:274)
    ... 18 more
    hdfs://quickstart.cloudera:8020/tmp/temp-193566860/tmp-1023933528,

Input(s):
Failed to read data from "hdfs://quickstart.cloudera:8020/user/cloudera/user/cloudera"

Output(s):
Failed to produce result in "hdfs://quickstart.cloudera:8020/tmp/temp-193566860/tmp-1023933528"

Counters:
Total records written : 0
Total bytes written : 0
Spillable Memory Manager spill count : 0
Total bags proactively spilled: 0
Total records proactively spilled: 0

Job DAG:
job_1447417089361_0004


2015-11-13 06:37:10,850 [main] INFO  org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLauncher - Failed!
2015-11-13 06:37:10,853 [main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 1066: Unable to open iterator for alias B
Details at logfile: /home/cloudera/pig_1447424730804.log
ベンワトソン

解決:

コードの1行目を次のように変更します。

A= load '/user/cloudera' using PigStorage(':');

そうは言っても、あなたの入力データはあなたのホームエリアにあると確信していますか?それはありそうもないようです。ホームエリア内のフォルダにある可能性が高くなります/user/cloudera/input-data

ジョブを実行する前に、次のことを行ってください。

hdfs dfs -ls /user/cloudera

入力データが実際にそのフォルダにあることを確認します。そうでない場合は、実際の場所を調べて、ローカルではなくHDFS上にあることを確認してください。

説明:

ログの関連部分は

ERROR 2118: Input path does not exist: hdfs://quickstart.cloudera:8020/user/cloudera/user/cloudera

これは、入力パスに関連していることを示しています。入力パスを処理するコードの部分は次のとおりです。

A= load 'user/cloudera' using PigStorage(':');

スラッシュを追加しないことにより/user、すべてがホームエリアに関連していると想定されるため、たとえば、書き込みを行うload 'input'と、Pigジョブが読み込まれhdfs://quickstart.cloudera:8028/user/cloudera/inputます。あなたの場合、スラッシュが欠落しているということは、それがユーザー領域に追加されることを意味します。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

Scalaコードで次のエラーを解決するにはどうすればよいですか?

分類Dev

次のHTMLエラーを解決するにはどうすればよいですか?

分類Dev

次のエラーを解決するにはどうすればよいですか?

分類Dev

VBA関数エラーのエラーを解決するにはどうすればよいですか?

分類Dev

bashの浮動値によるエラーを解決するにはどうすればよいですか?

分類Dev

Matlabのdrawcircleに関するエラーを解決するにはどうすればよいですか?

分類Dev

beautifulsoupを使用する際の属性エラーを解決するにはどうすればよいですか?

分類Dev

次の条件を解決するにはどうすればよいですか?

分類Dev

Kotlinでクラスの膨張エラーを解決するにはどうすればよいですか?

分類Dev

MySQL Workbenchでこれらの行エラーを解決するにはどうすればよいですか?

分類Dev

Postmanの使用中にnodejsでCORSエラーを解決するにはどうすればよいですか?

分類Dev

レコードの更新中にエラーを解決するにはどうすればよいですか?

分類Dev

VHDLでコードのエラーを解決するにはどうすればよいですか?

分類Dev

WebGL Unityゲームでこのエラーを解決するにはどうすればよいですか?

分類Dev

このDirectXコードのエラーを解決するにはどうすればよいですか?

分類Dev

Jspプログラムのエラーを解決するにはどうすればよいですか?

分類Dev

OJの「ランタイムエラー」を解決するにはどうすればよいですか

分類Dev

これらのMaven内部エラーを解決するにはどうすればよいですか?

分類Dev

「使用された値の使用」エラーを解決するにはどうすればよいですか?

分類Dev

新しいエラーのAngularCLIを解決するにはどうすればよいですか?

分類Dev

rsync からのエラー「execv: No such file or directory」を解決するにはどうすればよいですか?

分類Dev

POST中にこの422エラーを解決するにはどうすればよいですか?

分類Dev

JavaでこのNullPointerExceptionエラーを解決するにはどうすればよいですか?

分類Dev

MiniZincでこのエラーを解決するにはどうすればよいですか?

分類Dev

React + MaterialUIでこのエラーを解決するにはどうすればよいですか?

分類Dev

schemaspyでこのエラーを解決するにはどうすればよいですか?

分類Dev

XAMLで「タイプの欠落」エラーを解決するにはどうすればよいですか?

分類Dev

画像のDjangoで404エラーを解決するにはどうすればよいですか?

分類Dev

Pythonで線形方程式のエラーを解決するにはどうすればよいですか?

Related 関連記事

  1. 1

    Scalaコードで次のエラーを解決するにはどうすればよいですか?

  2. 2

    次のHTMLエラーを解決するにはどうすればよいですか?

  3. 3

    次のエラーを解決するにはどうすればよいですか?

  4. 4

    VBA関数エラーのエラーを解決するにはどうすればよいですか?

  5. 5

    bashの浮動値によるエラーを解決するにはどうすればよいですか?

  6. 6

    Matlabのdrawcircleに関するエラーを解決するにはどうすればよいですか?

  7. 7

    beautifulsoupを使用する際の属性エラーを解決するにはどうすればよいですか?

  8. 8

    次の条件を解決するにはどうすればよいですか?

  9. 9

    Kotlinでクラスの膨張エラーを解決するにはどうすればよいですか?

  10. 10

    MySQL Workbenchでこれらの行エラーを解決するにはどうすればよいですか?

  11. 11

    Postmanの使用中にnodejsでCORSエラーを解決するにはどうすればよいですか?

  12. 12

    レコードの更新中にエラーを解決するにはどうすればよいですか?

  13. 13

    VHDLでコードのエラーを解決するにはどうすればよいですか?

  14. 14

    WebGL Unityゲームでこのエラーを解決するにはどうすればよいですか?

  15. 15

    このDirectXコードのエラーを解決するにはどうすればよいですか?

  16. 16

    Jspプログラムのエラーを解決するにはどうすればよいですか?

  17. 17

    OJの「ランタイムエラー」を解決するにはどうすればよいですか

  18. 18

    これらのMaven内部エラーを解決するにはどうすればよいですか?

  19. 19

    「使用された値の使用」エラーを解決するにはどうすればよいですか?

  20. 20

    新しいエラーのAngularCLIを解決するにはどうすればよいですか?

  21. 21

    rsync からのエラー「execv: No such file or directory」を解決するにはどうすればよいですか?

  22. 22

    POST中にこの422エラーを解決するにはどうすればよいですか?

  23. 23

    JavaでこのNullPointerExceptionエラーを解決するにはどうすればよいですか?

  24. 24

    MiniZincでこのエラーを解決するにはどうすればよいですか?

  25. 25

    React + MaterialUIでこのエラーを解決するにはどうすればよいですか?

  26. 26

    schemaspyでこのエラーを解決するにはどうすればよいですか?

  27. 27

    XAMLで「タイプの欠落」エラーを解決するにはどうすればよいですか?

  28. 28

    画像のDjangoで404エラーを解決するにはどうすればよいですか?

  29. 29

    Pythonで線形方程式のエラーを解決するにはどうすればよいですか?

ホットタグ

アーカイブ