R语言中的数据分析
2006年Jim Portzak在关于 R 会议 介绍了带 R 的数据分析.他展示了如何使用网格和基础图形的组合来绘制数据的摘要面板。
不幸的是,代码尚未发布为软件包,因此当我最近需要在分析方案开始时快速查看几个数据集,我就开始寻找替代品。快速搜索显示了收购建议类似功能的两种选项:r2lUniv包装和描述 ()函数在杂项包装。
R2LGBIC
R2LGBIC包装通过计算每个变量的几个统计量(频率、中心度、离散度、图表),对单个变量或数据文件进行快速分析,并将结果以乳胶格式输出。输出根据变量类型而变化。
> library(r2lUniv) |
可以指定要插入每个节前面的文本。
> textBefore <- paste("\\subsection{", names(mtcars), + "}", sep = "") > rtlu(mtcars, "fileOut.tex", textBefore = textBefore) |
The functionRTLUMainFile生成乳胶主文档设计,并允许进一步定制报告。
> text <- "\\input{fileOut.tex}" > rtluMainFile("r2lUniv_report.tex", text = text) |
然后可以将生成的 Tex 文件转换为 PDF。
> library(tools) > texi2dvi("r2lUniv_report.tex", pdf = TRUE, clean = TRUE) |
MPG-变量的示例输出:
在此可以看到最终的 PDF 输出:r2lUniv_report.pdf.
杂项
所述的描述函数在HMISC 程序包确定变量是否为字符、因子、类别、二进制、离散数字和连续数字,并根据每个变量打印简明统计摘要。胶乳报告还包括显示频率计数的尖峰直方图。
> library(Hmisc) |
> db <- describe(mtcars, size = "normalsize") |
最简单和最快的方法是将结果打印到控制台。
> db$mpg mpg n missing unique Mean .05 .10 .25 .50 32 0 25 20.09 12.00 14.34 15.43 19.20 .75 .90 .95 22.80 30.09 31.30 lowest : 10.4 13.3 14.3 14.7 15.0 highest: 26.0 27.3 30.4 32.4 33.9 |
可替换地,一个可以转换描述将对象插入到一个LateX文件中。
> x <- latex(db, file = "describe.tex") |
猫用于生成 Tex-Report。
> text2 <- "\\documentclass{article}\n\\usepackage{relsize,setspace}\n\\begin{document}\n\\input{describe.tex} \n\\end{document}" > cat(text2, file = "Hmisc_describe_report.tex") |
> library(tools) > texi2dvi("Hmisc_describe_report.tex", pdf = TRUE) |
MPG-变量的示例输出:
在此可以看到最终的 PDF-报告:Hmisc_describe_report.pdf.
结论
这两种功能都提供了类似的数据快照,但我更喜欢描述功能可用于更简洁的输出,也可用于期权将分析打印到控制台。同时我喜欢生成的摘要图r2lUniv由于标签的字体大小较小,我发现它们很难在 PDF-Report 中阅读