通过jython实现的话,我们需要引入jar包(jython官网:https://www.jython.org/),具体我写了一个demo,假设你的python代码为test.py:
public static void main(String[] args) { PythonInterpreter interpreter = new PythonInterpreter(); interpreter.execfile("E:\\workspace\\pycharm_workspace\\weixincrawer\\test.py"); PyFunction function = (PyFunction)interpreter.get("my_test",PyFunction.class); PyObject pyobject = function.__call__(new PyString("huzhiwei"),new PyString("25")); System.out.println("anwser = " + pyobject.toString()); }
输出结果:
name: huzhiwei age: 25 anwser = success
到此是没有什么问题的,我们使用function.call方法传入参数调用python函数,使用pyobject.toString()方法拿到python中my_test函数的返回值,但是如果你把test.py稍微做下修改如下:
import requests def my_test(name, age): response = requests.get("http://www.baidu.com") print("name: "+name) print("age: "+age) return "success"
不修改java调用代码的情况下,你会得到下面异常信息:
ImportError: No module named requests
没错,这就是我要讨论的问题,因为jython不可能涵盖所有python第三方类库的东西,所以在我们得python文件中用到requests类库的时候,很显然会报找不到模块的错误,这个时候我们是可以通过Runtime.getRuntime()开启进程来执行python脚本文件的。
使用这种方式需要同时修改python文件以及java调用代码,在此我同样在上面test.py的基础上进行修改:
import requests import sys def my_test(name, age): response = requests.get("http://www.baidu.com") print("url:"+response.url) print("name: "+name) print("age: "+age) return "success" my_test(sys.argv[1], sys.argv[2])
和上面test.py代码最大的区别在于,我们此处开启进程的方式实际上是在隐形的调用dos界面进行操作,因此在python代码中我们需要通过sys.argv的方式来拿到java代码中传递过来的参数。
java调用代码部分:
public static void main(String[] args) { String[] arguments = new String[] {"python", "E:\\workspace\\pycharm_workspace\\weixincrawer\\test.py", "huzhiwei", "25"}; try { Process process = Runtime.getRuntime().exec(arguments); BufferedReader in = new BufferedReader(new InputStreamReader(process.getInputStream())); String line = null; while ((line = in.readLine()) != null) { System.out.println(line); } in.close(); int re = process.waitFor(); System.out.println(re); } catch (Exception e) { e.printStackTrace(); } }
结果输出:
url:http://www.baidu.com/ name: huzhiwei age: 25 0
在此需要注意的一点,java代码中的process.waitFor()返回值为0表示我们调用python脚本成功,返回值为1表示调用python脚本失败,这和我们通常意义上见到的0与1定义正好相反。
在本人的实际项目需求开发时,基本上也是模仿上面的思路进行的,python脚本成功在PyCharm Community中也执行也成功,获得了所请求的网页数据,但是在java环境中通过Process.waitFor()调用python模块返回错误代码1。
经过多次尝试和分析,发现
问题原因:我的请求的URL设置为安全Http了,即https了,在PyCharm Community IDE可能存在HTTPS相关的处理模块所以执行成功。但是在java环境中通过Process.waitFor()调用python模块,实质上是通过dos/cmd命令行执行python.exe *.py命令的。而在这种情况下,由于环境中缺少HTTPS相关的处理模块所以执行不成功。
解决办法:将请求的URL由安全Https修改为http即可。
下面附上我的示例代码:
被调用的python代码模块为:
#!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2020/3/6 23:41 # @Author : # @File : URLibTest.py import urllib.request import sys def WebSpider(name, age): response = urllib.request.urlopen(‘http://celestrak.com/satcat/tle.php?CATNR=25994‘) print(response.read().decode(‘utf-8‘)) WebSpider(sys.argv[1], sys.argv[2]) # WebSpider("huzhiwei", "25")
主调的java代码模块为:
package cn.cetc; import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; public class JavaInvokePython { private static final String pyInterpreterPath = "C:\\Anaconda3\\python.exe";//注意:当命令行参数分开写的时候,exe后面不用添加一个空格。当命令行参数一起写的时候,exe后面一定要添加一个空格 private static final String pyFilePath = "URLibTest.py";//如果未指定.py文件的完全路径,则默认从工程当前目录下搜索 private static Process proc = null;//java进程类 /** * 执行*.py文件 */ public static void execPy() { try { String[] arguments = new String[] {pyInterpreterPath, pyFilePath, "huzhiwei", "25"};//实际上后两个参数传进入也没使用。当真正需要有参数传入时可以是利用这种方式传参 proc = Runtime.getRuntime().exec(arguments); BufferedReader in = new BufferedReader(new InputStreamReader(proc.getInputStream())); String line = null; while ((line = in.readLine()) != null) { System.out.println(line); } in.close(); int re = proc.waitFor();//返回0:成功。其余返回值均表示失败,如:返回错误代码1:操作不允许,表示调用python脚本失败 System.out.println(re); } catch (IOException e) { e.printStackTrace(); } catch (InterruptedException e) { e.printStackTrace(); } } public static void main(String[] args) { execPy(); } }
注意:上述java代码运行环境不需要额外安装Jython-x.x.x.jar,只需要一般的JDK环境和常规的需要的包导入。
参考链接:
[转]java调用python脚本以及通过Process.waitFor()直接调用python模块返回错误代码1的一种解决办法
原文:https://www.cnblogs.com/rainbow70626/p/12520856.html