Pyspark:アーカイブ内からスクリプトを実行します

ギヨーム

ヤーンマスターモードのpysparkで簡単に使用できるアーカイブ(基本的にはバンドルされたconda環境+アプリケーション)があります。

PYSPARK_PYTHON=./pkg/venv/bin/python3 \ 
spark-submit \
--conf spark.yarn.appMasterEnv.PYSPARK_PYTHON=./pkg/venv/bin/python3 \
--master yarn \
--deploy-mode cluster \
--archives hdfs:///package.tgz#pkg \
app/MyScript.py

これは期待どおりに機能しますが、ここでは驚くことではありません。

MyScript.pyがpackage.tgz内にある場合、どうすればこれを実行できますか私のローカルファイルシステムではありませんか?

コマンドの最後の行をたとえばに置き換えたいと思います。./pkg/app/MyScript.pyしかし、その後、スパークは不平を言います:java.io.FileNotFoundException: File file:/home/blah/pkg/app/MyScript.py does not exist

もちろん、最初に抽出して、hdfsに個別に配置することもできます...回避策はありますが、すべてが1つの素敵な場所にあるので、使用したいと思います。

関連する場合、これはCDH上のspark 2.4.0、python3.7です。

サットン

私が理解しているように、できません。Pythonスクリプトをに提供する必要がありますspark-submit

ただし、非常に短いスクリプトを使用--py-filesして、残りのコードのZIPまたはEGGを配布することができます。

# go.py

from my.app import run

run()
# my/app.py

def run():
  print("hello")

myディレクトリを含むZIPファイルを作成し、短いエントリポイントスクリプトで送信できます。 spark-submit --py-files my.zip go.py

必要にgo.py応じて、インポートして実行するモジュールとメソッドを指示する引数を受け入れるジェネリック作成できます。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

ローカルサーバーからクライアントでBashスクリプトを実行しますか?

分類Dev

アーカイブ内からアーカイブディレクトリの内容のみを抽出します

分類Dev

アーカイブ内からアーカイブディレクトリの内容のみを抽出します

分類Dev

クラスライブラリ(dll)からwpfアプリケーションを実行します

分類Dev

LinuxのアイコンからPythonスクリプトを実行します

分類Dev

Wixインストーラー内のカスタムアクションから.Netインストーラーを実行しますか?

分類Dev

CLIからイジェクトせずにWebワーカー内でAngularアプリを実行する

分類Dev

Pythonスクリプトからインタラクティブモードを実行します

分類Dev

デスクトップのショートカットからshファイルを実行してアプリを実行する方法

分類Dev

メインクラスまたはスタートアップリスナーからエフェメラルSpring Bootアプリを実行しますか?

分類Dev

アンカータグがクリックされた後、Jquery内からgetリクエストを実行します

分類Dev

PythonツイストはウェブサイトからCLIスクリプトを実行します

分類Dev

ローカルホストで1つのansibleプレイブックタスクを実行してから、リモートサーバーで別のタスクを実行します

分類Dev

ハイブスクリプトを別のハイブスクリプトから実行できますか?

分類Dev

virtualenvをアクティブにし、.batから.pyスクリプトを実行します

分類Dev

ブラウザからローカルホストで実行されているSignalRアプリケーションにアクセスします

分類Dev

Pythonアプリケーションを実行し、ディレクトリ内の別のパスからモジュールをインポートする

分類Dev

ファイル内からノードスクリプトを実行する

分類Dev

タイムアウトになるまでループ内でコマンドを実行してから、変数をエクスポートします

分類Dev

Java / ScalaプログラムのDataStreamからSQLテーブルを作成し、SQLクライアントCLIからクエリを実行します-Apache Flink

分類Dev

ストリームをアーカイブ内のファイルからByte []に変換します

分類Dev

Bashスクリプト:ループ内で1回何かを実行してから停止しますが、ループを続行します

分類Dev

Angular2のローカルホストからplugin-typescriptライブラリを実行します

分類Dev

実行中のスクリプトから新しいターミナルタブでスクリプトを実行しようとしています

分類Dev

PythonスクリプトからIPythonノートブックセルを実行します

分類Dev

コマンドラインからPythonスクリプトを実行してから、インタラクティブモードに入ります

分類Dev

Djangoアプリ内からPythonスクリプトを実行する

分類Dev

PowerShellスクリプト内の特定のフォルダーからcmdを実行します

分類Dev

jQueryダイアログボタンからスクリプトを実行しますか?

Related 関連記事

  1. 1

    ローカルサーバーからクライアントでBashスクリプトを実行しますか?

  2. 2

    アーカイブ内からアーカイブディレクトリの内容のみを抽出します

  3. 3

    アーカイブ内からアーカイブディレクトリの内容のみを抽出します

  4. 4

    クラスライブラリ(dll)からwpfアプリケーションを実行します

  5. 5

    LinuxのアイコンからPythonスクリプトを実行します

  6. 6

    Wixインストーラー内のカスタムアクションから.Netインストーラーを実行しますか?

  7. 7

    CLIからイジェクトせずにWebワーカー内でAngularアプリを実行する

  8. 8

    Pythonスクリプトからインタラクティブモードを実行します

  9. 9

    デスクトップのショートカットからshファイルを実行してアプリを実行する方法

  10. 10

    メインクラスまたはスタートアップリスナーからエフェメラルSpring Bootアプリを実行しますか?

  11. 11

    アンカータグがクリックされた後、Jquery内からgetリクエストを実行します

  12. 12

    PythonツイストはウェブサイトからCLIスクリプトを実行します

  13. 13

    ローカルホストで1つのansibleプレイブックタスクを実行してから、リモートサーバーで別のタスクを実行します

  14. 14

    ハイブスクリプトを別のハイブスクリプトから実行できますか?

  15. 15

    virtualenvをアクティブにし、.batから.pyスクリプトを実行します

  16. 16

    ブラウザからローカルホストで実行されているSignalRアプリケーションにアクセスします

  17. 17

    Pythonアプリケーションを実行し、ディレクトリ内の別のパスからモジュールをインポートする

  18. 18

    ファイル内からノードスクリプトを実行する

  19. 19

    タイムアウトになるまでループ内でコマンドを実行してから、変数をエクスポートします

  20. 20

    Java / ScalaプログラムのDataStreamからSQLテーブルを作成し、SQLクライアントCLIからクエリを実行します-Apache Flink

  21. 21

    ストリームをアーカイブ内のファイルからByte []に変換します

  22. 22

    Bashスクリプト:ループ内で1回何かを実行してから停止しますが、ループを続行します

  23. 23

    Angular2のローカルホストからplugin-typescriptライブラリを実行します

  24. 24

    実行中のスクリプトから新しいターミナルタブでスクリプトを実行しようとしています

  25. 25

    PythonスクリプトからIPythonノートブックセルを実行します

  26. 26

    コマンドラインからPythonスクリプトを実行してから、インタラクティブモードに入ります

  27. 27

    Djangoアプリ内からPythonスクリプトを実行する

  28. 28

    PowerShellスクリプト内の特定のフォルダーからcmdを実行します

  29. 29

    jQueryダイアログボタンからスクリプトを実行しますか?

ホットタグ

アーカイブ