我有一些Java第三方数据库客户端库。我想通过访问它们
java_gateway.py
例如:通过Java网关使客户端类(不是JDBC驱动程序!)可用于Python客户端:
java_import(gateway.jvm, "org.mydatabase.MyDBClient")
目前尚不清楚将第三方库添加到JVM类路径的位置。我试图将其添加到文件compute-classpath.sh,但这似乎没有用。我得到:
Py4jError:尝试调用程序包
另外,与Hive相比:Hive JAR文件没有通过文件compute-classpath.sh加载,这使我感到怀疑。似乎还有其他机制正在建立JVM端类路径。
您可以将外部jar添加为pyspark的参数
pyspark --jars file1.jar,file2.jar
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句