R语言学习笔记(1):R是什么的问题
在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!!
1. R初窥
从CRAN(The Comprehensive R ArcHive Network)cran.r-project.org—mirrors.html中选择一个镜像,然后下载合适的安装包(R支持Linux、Mac oX和Windows)。
安装并运行R后,可以看到R的控制台(我的操作系统是Mac OS):
在R的控制台输入如下命令:
oracle教程
- > install.packages('quantmod') # 安装quantmod包
- > require(quantmod) #引用quantmod包
- > getSymbols(“GOOG”,src=”yahoo”,from=”2013-01-01″, to='2013-04-24') #从雅虎财经获取google的股票数据
- > chartSeries(GOOG,up.col='red',dn.col='green') #显示K线图 > addMACD() #增加MACD图
就能够看到下图的效果了:
最后,退出R:
- > q()#Terminate an R Session
2. R是什么
是不是很神奇?反正当时我完全被Hold住了。
那么R到底是什么?或者说,R到底是做什么用的?从不同的角度出发,对R会有不同的描述。
从使用角度,R是一个有着统计分析功能及强大作图功能的软件,在GNU协议General Public Licence4下免费发行。
从编程角度,R语言是面向对象的统计编程语言,是由AT&T贝尔实验室所创的S语言发展出的一种方言。
从计算角度,R 是一种为统计计算和图形显示而设计的语言及环境。
从开发角度,R 是一组开源的数据操作,计算和图形显示工具的整合包有各种方式可以进行编程调用。
从架构角度,R 是为统计计算和图形展示而设计的一个系统。它包括一种编程语言,高级别图形展示函数,和其它语言的接口以及调试工具。
如果一定要找到一个与R类似的软件,那就是商业软件Matlab。R和Matlab都是基于编程进行数据分析的工具,Matlab适用的领域更广,而R更擅长统计分析领域。
与Matlab相比,R更具备开放性:
R是自由软件,Matlab是商业软件;
R可以方便的通过“包”进行扩展,R的核心只有25个包,但是有几千个外部包可以调用,当然你也可以开发自己的;
R语言比Matlab的要强大;
R和其他编程语言/数据库之间有很好的接口;其他语言也可以很方便的调用R的API和结果对象。
R常用于金融和统计领域。大多数人使用R就是因为它的统计功能,R的内部实现了很多经典的or时髦的统计技术oracle视频教程。
3. R的核心概念
3.1 对象
R语言是一种面向对象的语言,所有的对象都有两个内在属性:元素类型和长度。
元素类型是对象内元素的基本类型,包括:数值(numeric),字符型(character),复数型(complex)、逻辑型(logical)、函数(function)等,通过mode()函数可以查看一个对象的类型。
长度是对象中元素的数目,通过函数length()可以查看对象的长度。
除了元素类型外,对象本身也有不同的“类型”,表示不同的数据结构(struct)。R中的对象类型主要包括:
向量(vector): 由一系列有序元素构成。
因子(factor):对同长的其他向量元素进行分类(分组)的向量对象。R 同时提供有序(ordered)和无序(unordered)因子。
数组(array):带有多个下标的类型相同的元素的集合
矩阵(matrix):矩阵仅仅是一个双下标的数组。R提供了一下函数专门处理二维数组(矩阵)。
数据框(data frame):和矩阵类似的一种结构。在数据框中,列可以是不同的对象。
时间序列(time series):包含一些额外的属性,如频率和时间.
列表(list):是一种泛化(general form)的向量。它没有要求所有元素是同一类型,许多时候就是向量和列表类型。列表为统计计算的结果返回提供了一种便利的方法。
3.2 常量
R中还定义了一些常量,比如:
NA:表示不可用
Inf: 无穷
-Inf: 负无穷
TRUE:真
FALSE:假
4. R的基本使用
4.1 命令
R是一种语法非常简单的表达式语言(expression language)。使用者通过命令(command)与R进行交互。oracle数据库教程
基本命令要么是表达式(expressions)要么就是赋值(assignments)。如果一条命令是表达式,那么它将会被解析(evaluate),并将结果显示在屏幕上,同时清空该命令所占内存。赋值同样会解析表达式并且把值传给变量但结果不会自动显示在屏幕上。
基于命令,可以用交互的方式或者批处理/脚本文件的方式使用R。
4.2 交互式使用 R
交互式shell是一种很方便的环境,可以进行各种尝试,随时调整过程。与Python、Ruby等语言一样,R也提供了shell环境。本文开始的例子就是以交互的方式使用R。当打开R控制台时,R会显示命令提示符”>”,此时可以输入命令。
下面是交互式使用R的几个例子:
例一:
- > help.start() #启动在线帮助,会打开浏览器。
- > x
- > plot(x,y) #使用x,y画二维散点图, 会打开一个图形窗口
- > ls() #查看当前工作空间里面的 R 对象
- > rm(x,y) #清除x,y对象
- >x
#p#分页标题#e#
例二:
经李克强总理签批,2015年9月,国务院印发《促进大数据发展行动纲要》(以下简称《纲要》),系统部署大数据发展工作。
《纲要》明确,推动大数据发展和应用,在未来5至10年打造精准治理、多方协作的社会治理新模式,建立运行平稳、安全高效的经济运行新机制,构建以人为本、惠及全民的民生服务新体系,开启大众创业、万众创新的创新驱动新格局,培育高端智能、新兴繁荣的产业发展新生态。
《纲要》部署三方面主要任务。一要加快政府数据开放共享,推动资源整合,提升治理能力。大力推动政府部门数据共享,稳步推动公共数据资源开放,统筹规划大数据基础设施建设,支持宏观调控科学化,推动政府治理精准化,推进商事服务便捷化,促进安全保障高效化,加快民生服务普惠化。二要推动产业创新发展,培育新兴业态,助力经济转型。发展大数据在工业、新兴产业、农业农村等行业领域应用,推动大数据发展与科研创新有机结合,推进基础研究和核心技术攻关,形成大数据产品体系,完善大数据产业链。三要强化安全保障,提高管理水平,促进健康发展。健全大数据安全保障体系,强化安全支撑。[11]
2015年9月18日贵州省启动我国首个大数据综合试验区的建设工作,力争通过3至5年的努力,将贵州大数据综合试验区建设成为全国数据汇聚应用新高地、综合治理示范区、产业发展聚集区、创业创新首选地、政策创新先行区。
围绕这一目标,贵州省将重点构建“三大体系”,重点打造“七大平台”,实施“十大工程”。
“三大体系”是指构建先行先试的政策法规体系、跨界融合的产业生态体系、防控一体的安全保障体系;“七大平台”则是指打造大数据示范平台、大数据集聚平台、大数据应用平台、大数据交易平台、大数据金融服务平台、大数据交流合作平台和大数据创业创新平台;“十大工程”即实施数据资源汇聚工程、政府数据共享开放工程、综合治理示范提升工程、大数据便民惠民工程、大数据三大业态培育工程、传统产业改造升级工程、信息基础设施提升工程、人才培养引进工程、大数据安全保障工程和大数据区域试点统筹发展工程。
此外,贵州省将计划通过综合试验区建设,探索大数据应用的创新模式,培育大数据交易新的做法,开展数据交易的市场试点,鼓励产业链上下游之间的数据交换,规范数据资源的交易行为,促进形成新的业态。
国家发展改革委有关专家表示,大数据综合试验区建设不是简单的建产业园、建数据中心、建云平台等,而是要充分依托已有的设施资源,把现有的利用好,把新建的规划好,避免造成空间资源的浪费和损失。探索大数据应用新的模式,围绕有数据、用数据、管数据,开展先行先试,更好地服务国家大数据发展战略。
- x
- w
- detach()
- rm(fm, fm0)#在进行下面工作前,清空数据。
- #下面是等高线和影像显示的示例
- x
- y
- f
- oldpar
- par(pty=”s”)#保存图形参数,设定图形区域为“正方形”。
- contour(x, y, f)
- contour(x, y, f, nlevels=15, add=TRUE)#绘制 f 的等高线;增加一些曲线显示细节。
- fa
- contour(x, y, fa, nlevels=15)#画等高线
- par(oldpar)# 恢复原始的图形参数
- image(x, y, f)
- image(x, y, fa)#绘制一些高密度的影像显示
- objects();
- rm(x, y, f, fa)#在继续下一步前,清空数据。
- th
- z
- par(pty=”s”)
- plot(z, type=”l”)#图形参数是复数时,表示虚部对实部画图。这可能是一个圆。
- w
- w 1, 1/w, w)#将圆外的点映射成它们的倒数。
- plot(w, xlim=c(-1,1), ylim=c(-1,1), pch=”+”,xlab=”x”, ylab=”y”)
- lines(z)#所有的点都在圆中,但分布不是均匀的。
- #下面采用均匀分布。现在圆盘中的点看上去均匀多了。
- w
- plot(w, xlim=c(-1,1), ylim=c(-1,1), pch=”+”, xlab=”x”, ylab=”y”)
- lines(z)
- rm(th, w, z)#再次清空。
- q()#离开 R 程序
#p#分页标题#e#
4.3 工作空间(workspace)
R shell 可以任意地保存一个完整的环境,称为工作空间(workspace)。前面的例子中,运行q()命令退出R时,会被询问是否要保存工作空间:oracle视频
工作空间(workspace)保存了一些环境信息。每次与R的会话(session)可以从一个全新的环境开始,也可以在原来的基础上继续,这些运行信息就保存在工作空间中。
如果在Unix系统以命令行的方式启动R,则当前目录就是本次会话的工作空间:
$ mkdir r_test
$ cd r_test/
$ R
看看R能为工作空间保存些什么内容:
> x > q()
Save workspace image? [y/n/c]: y
$ ls -Al
会发现R保存了两个隐藏文件:.RData和.Rhistory。其中.RData以二进制的方式保存了会话中的变量值,.Rhistory以文本文件的方式保存了会话中的所有命令。
如果在一个已有的工作空间中启动R,会提示:
[原来保存的工作空间已还原]
此时可以用函数ls()和history()看到之前保存的数据和命令。
使用rm()/remove()可以删除工作空间中的变量。
在R控制台,也可以使用函数getwd()和setwd()来获取/设置工作空间目录;使用list.files()查看当前目录下的文件。
如果以GUI方式运行R控制台,可以通过菜单来加载或保存工作空间。
4.4 脚本/批处理
前面提到R可以在工作空间中保存历史命令。其实这就是一个工作空间中的默认脚本,当加载工作空间时自动执行。
我们完全可以写自己的脚本,指定R批量执行一些命令。通常,自己的脚本会以“.R”作为扩展名。一个最简单的例子test.R:
x plot(x,y) #使用x,y画二维散点图, 会打开一个图形窗口
并保存到工作空间,然后在R控制台,使用命令:
> source('test.R')
就可以执行该脚本。
> source('test.R', echo=TRUE)可以让脚本执行时输出更详细的信息。
编写脚本自动执行一些任务时,sink()函数会比较有用:
> sink(“record.lis”)
会把所有后续的输出结果从控制台重定向到外部文件 record.lis 中,此时控制台中看不到命令输出的结果。使用命令:
> sink()
可以让输出流重新定向到控制台。
5. 帮助系统
GNU软件通常都会有非常好的帮助系统,无论对于初学者还是熟练者都能带来很大的帮助。R当然也不例外。R中提供的帮助主要有以下几种:
5.1 文档和搜索
help.start() 命令会打开浏览器,显示帮助文档。包括一些入门的文档,以及搜索功能(链接:Search Engine & KeyWord)。
5.2 演示
demo()会按照包分组,列出所有可用的演示:
按照名称可以开始演示,如:
demo(is.things)
5.3 函数帮助
如果已经知道一个函数的名称(比如solve),需要了解其所属的包、用途、用法、参数说明、返回值、参考文献、相关函数以及范例等,可以使用命令
help(solve)或 ?solve
该命令会弹出一个窗口:
5.4 函数示例
对于函数,还可以使用example()执行示例,比如:
example(solve)
5.5 关键字和运算符
与函数的帮助类似,但是需要加上引号,如:
> ? '[[' # 等价于 help('[[')
> ?'+' #等价于 help('+')
> ?'if' #等价于 help('if')
5.6 搜索
如果不知道函数名称,还可以进行搜索,比如:
??'analysis' #等价于 search('analysis')
5.7 官方搜索
前面的帮助都受限于本地环境已经安装的包。如果要搜索R中所有的资源(包,函数、数学方法等),需要在R的官方网站搜索:
www.r-project.org—search.html
6. 学习资料
www.R-project.org R官方网站
cran.r-project.org—manuals.html 官方网站上的一些手册和文档(必看)
staff.washington.edu—Rcourse 华盛顿大学的一个R教程
更多视频课程文章的课程,可到课课家官网查看。我在等你哟!!!