R与JAVA的整合
R是统计计较的强大东西,而Java是做应用系统的主流语言,两者天然具有整合的需要。关于整合,一方面,R中可以建设JAVA工具挪用JAVA要领,另一方面,JAVA中可以转换R的数据范例挪用R的函数,相互取长补短。此刻也有一个项目JGR,用JAVA做R的图形界面,可以实现高亮显示自动补全等,还能让JAVA和R相互挪用。
关于R中挪用JAVA,我想主要是为了操作其面向工具的特性,究竟R语言迩来很致力于向面向工具成长,有个很好的项目rJava可以实现,在www.rforge.net/rJava上。R中调JAVA对我好像意义不大,本文主要先容JAVA中挪用R。所有测试都在Windows XP、R2.10.1和JDK1.6下完成。
JAVA很适合开拓应用系统,可是数学建模和计较本领非其所长,假如该系统需要举办大量的统计可能优化的计较,挪用R是一种很好的方法。JAVA认真系统的构建,R用来做运算引擎,从而实现应用型和阐明性相团结的系统。
首先要先容的是Rserve的方法,这是一个基于TCP/IP的处事器,通过二进制协议传输数据,可以提供长途毗连,使得客户端语言可以或许挪用R。今朝Rserve作为一个package宣布在CRAN上,可以直接利用install.packages(“Rserve”)举办安装。需要利用时在R节制台下加载该包,然后输入呼吁Rserve(),开启处事器,就可以供客户端挪用。
其客户端可以有多种,这里只先容JAVA客户端。最早的客户端包是JRclient,在www.rosuda.org/Rserve上还可以下载到,可是此刻该项目全部移到了www.rforge.net/Rserve,利用REngine作客户端(和JRI一致),在该网站下可以下载到REngine.jar和RserveEngine.jar两个文件。假如用eclipse开拓的话,在工程属性中导入这两个外部的jar包,就可以正常利用了。
一个简朴的例子:
public class rtest {
public static void main(String[] args) throws REXPMismatchException, REngineException {
RConnection c = new RConnection();
REXP x = c.eval(“R.version.string”);
System.out.println(x.asString());
}
}
首先成立一个新的毗连,然后就可以利用eval之类的要领将R中的表达式传随处事器端,通过R求值后传回JAVA中REXP范例的变量,然后打印出来,整个进程很是简朴。由于不需要对R举办初始化,因此速度会较量快。在其他系统下可以同时成立多个毗连,可是在Windows下只答允同时打开一个毗连,后续的毗连城市共有沟通的定名空间。官网上不发起在Windows下利用Rserve,因为会丧失许多机能,他们推荐可以思量DCOM的方法。不外DCOM谁人工程没有现成的jar包可用,其实假如是拿R做阐明系统中的运算引擎,单毗连够用了。另一种方法是JRI,全名是Java/R Interface,这是一种完全差异的方法,通过挪用R的动态链接库从而操作R中的函数等。今朝该项目已经成了rJava的子项目,不再提供单独的JRI的版本。因此利用时简朴地通过install.packages(“rJava”)安装rJava就行,在安装文件夹中,可以看到一个jri的子文件夹,内里有自带的例子可以用来测试。
装好后要修改系统的情况变量,在PATH中添加%R_HOME%bin和%R_HOME%libraryrJavajri,留意R_HOME的路径要正确,重启系统使之生效。利用时同样在eclipse里导入外部的jar包(在www.rforge.net/rJava下载JRI.jar、REngine.jar和JRIEngine.jar这三个文件),在rJava包安装目次下的jriexamples里有现成的例子(rtest.java和rtest2.java),可以测试是否乐成。
之前我的电脑上一直存在一个很奇怪的问题,测试第一个例子时在“Creating Rengine (with arguments)”的时候就愣住了,第二个例子中一个JAVA框很快闪一下就消失了,节制台中没有任何提示。打开JGR也是一闪即逝。在网上查了好久,只有一个印度哥们也碰着过雷同的问题,并且没有找到办理步伐。预计应该是实现RMainLoopCallbacks时出了问题,可是找不到原因,厥后卸载了R2.9.0重装了R2.10.1,而且通过install.packages安装,终于没问题了,大概是主措施和Package之间的版本斗嘴,以跋文住全部用install.packages来安装package了。
关于客户端处事器的方法和动态链接库的方法,各有所长,凭据需要选用。小我私家履历,不管利用哪种方法,设计时只管少举办频繁的数据的交互,在逻辑上把系统和计较分隔,使得R成为一个纯粹的运算引擎。