其他教程
其他教程包括金融和计算机...
-
摸索R包plyr:离开R中显式轮回 所有R用户接管的第一个“莫名其妙”的原则就是: 不要在R中写显式轮回… 不要写显式轮回… 不要写轮回… 不轮回… 不… 我第一次接管到这个“黄金律”,就跟当年从basic语言转到C语言的时候,老师说: 不要写go to… 不go to… 不… 一样的,好震撼。往往对付R用户来说,R根基上不行能是他们进修的第一门计较机语言,什么C啊Java啊甚至ma... 继续阅读摸索R包plyr:离开R中显式轮回
:2017-12-04
-
应用ROC函数计较多支股票收益率 有时候需要计较同一个data frame中的多支股票的收益率,实现这一目标最冒失的做法是对罗列办轮回。这个要领有失雅观且不足高效。显式轮回是应用R语言的大忌之一,所以才有了*apply族函数的降生,但是有时候,*apply函数也不是须要的。好比在计较多支股票收益率的时候,就可以用TTR包中的ROC函数取代。 > require(quantmod) &g... 继续阅读应用ROC函数计较多支股票收益率
:2017-12-04
-
R语言下的文本挖掘 一些应用都利用了自然语言处理惩罚技能。虽然,统计配景的阐明类科研人员更存眷于舆情阐明这类的文本挖掘技能。 许多统计软件都提供了文本挖掘的成果,好比常见的数据阐明软件SAS、SPSS等,下图是文本挖掘东西及特性的一个总结(来自于Journal of Statistical Software 2008) Preprocess:数据筹备、导入、清洗以及一般性的预处理惩罚; ... 继续阅读R语言下的文本挖掘
:2017-12-04
-
超过R与C++的桥梁:Rcpp 因为写R扩展的需要,我用Rcpp其实有一阵子了。我一直在强调,把利便和富厚的R情况与系统级语言如C/C++等团结才是适合我现时计较的王道。但R自带的C/C++的API接话柄在是太难用,极端限制人的利用欲望。我试图把它们用最简朴的方法论述过,好比可以看这里和这里。但实际应用中无法因繁就简,照旧制止不了写一大堆反复代码,记一大堆生僻的API。于是Rcpp成了我的救... 继续阅读超过R与C++的桥梁:Rcpp
:2017-12-04
-
现代分类要领在医学诊断中的应用——基于R的实现 1.引言 跟着统计科学的日益成长,其对其他学科的渗透浸染日益加强,数据阐明要领在医学、生物学、社会学等各个学科中获得了遍及的应用,本文试图对收集到的某个临床医学数据运用决定树、神经网络、支持向量机、随机丛林等各类现代分类要领举办阐明,以佐证数据挖掘对其他学科的重要意义;另一方面,就各类现代分类要领的实际结果举办比拟。 笔者从网上收集到关于某个脊椎... 继续阅读现代分类要领在医学诊断中的应用——基于R的实现
:2017-12-04
-
Hbase 先容(转载) 一、简介 hbase是bigtable的开源山寨版本。是成立的hdfs之上,提供高靠得住性、高机能、列存储、可伸缩、及时读写的数据库系统。它介于nosql和RDBMS之间,仅能通过主键(row key)和主键的range来检索数据,仅支持单行事务(可通过hive支持来实现多表join等巨大操纵)。主要用来存储非布局化和半布局化的松散数据。与hadoop一样,Hbase... 继续阅读Hbase 先容(转载)
:2017-12-04
-
深入比拟数据科学东西箱:Python和R之争 概述在真实的数据科学世界里,我们会有两个极度,一个是业务,一个是工程。方向业务的数据科学被称为数据阐明(Data Analysis),也就是A型数据科学。方向工程的数据科学被称为数据构建(Data Building),也就是B型数据科学。从东西上来看,按由业务到工程的顺序,这个两条是:Excel >> R >> Python... 继续阅读深入比拟数据科学东西箱:Python和R之争
:2017-12-04
-
R: 进修Gradient Boosting算法,提高预测模子精确率 引言预测模子的精确率可以用2种要领来提高:要么举办特征设计,要么直接利用boosting算法。介入过许大都据科学大赛后,我发明很多人喜欢用boosting算法,因为它只需更少的时间就能发生相似的功效。今朝有很多boosting算法,如Gradient Boosting、 XGBoost,、AdaBoost和Gentle Bo... 继续阅读R: 进修Gradient Boosting算法,提高预测模子精确率
:2017-12-04
-
R数据阐明傍边的化整为零(Split-Apply-Combine)计策 本文心得自:The Split-Apply-Combine Strategy for Data Analysis, Hadley Wickham, Journal of Statistical Software, April 2011, V.40. 引子: 我们经常会碰着这样的问题,数据量很大,并不需要依顺序来依次处理惩... 继续阅读R数据阐明傍边的化整为零(Split-Apply-Combine)计策
:2017-12-04
-
RHive的安装和用法 RHive 是一种通过HIVE高机能查询来扩展R计较本领的包。它可以在R情况中很是容易的挪用HQL, 也答允在Hive中利用R的工具和函数。理论上数据处理惩罚量可以无限扩展的Hive平台,搭配上数据挖掘的利器R情况, 堪称是一个完美的大数据阐明挖掘的事情情况。 情况设置 (设置部门是同事搞定的,只记录一些细节) RHive 依赖于Rserve,因此在安装R的时候有些变革... 继续阅读RHive的安装和用法
:2017-12-04