저는 현재 IBM Bluemix에서 Apache Spark 서비스를 사용하고 있습니다. Spark 서비스 자체, 데이터 용 OpenStack Swift 서비스 및 IPython / Jupyter 노트북으로 구성된 빠른 시작 복합 애플리케이션 (Boilerplate)이 있습니다.
시스템에 타사 라이브러리를 추가하고 싶은데 이것이 어떻게 달성 될 수 있는지 궁금합니다. Python import 문을 사용하는 것은 라이브러리가 SparkWorker 노드에 위치 할 것으로 예상되기 때문에 실제로 도움이되지 않습니다.
작업 런타임 중에 외부 소스 (예 : Swift 또는 ftp 소스)에서 Spark에서 Python 라이브러리를로드하는 방법이 있습니까?
감사합니다!
베타에서 현재 타사 라이브러리를 추가 할 수 없습니다. 이것은 인기있는 요구 사항이므로 베타에서 나중에 나올 것입니다 ;-)
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다