R是一款针对Windows而开发的且用于统计计算和图形编辑的语言环境,它可以在各种UNIX平台,Windows和macOS上编译并运行;R是用于统计计算和图形的语言和环境,这是一个类似于S语言和环境的U项目;R可以看作是S的不同实现,有一些重要的区别,但是为S编写的许多代码在R下都不会改变;R提供广泛的统计(线和非线建模,经典统计测试,时间序列分析,分类,聚类)和图形技术,并且高度可扩展。S语言通常是统计方研究的首选工具,R语言提供了一种开放源代码的途径来参与该活动;R的优势之一是可以轻松制作出精心设计的具有出版质量的图表,包括需要时的数学符号和公式;对于图形中次要设计选项的默认值,系统给用户用户保留完全控制权!
R
R 软件功能
根据自由软件基金会U通用公共许可的条款,该程序可以作为自由软件以源代码形式提供。
它可以在各种UNIX平台和类似系统(包括FreeBSD和Linux),Windows和macOS上编译并运行。
R是用于数据处理,计算和图形显示的软件功能的集成套件。这包括:
有效的数据处理和存储设施,
一组用于对数组(尤其是矩阵)进行计算的运算符,
大量,连贯,集成的中间工具,用于数据分析,
用于数据分析和在屏幕上或在硬拷贝上显示的图形功能,以及
一种发达,简单且有效的编程语言,包括条件,循环,用户定义的递归函数以及输入和输出功能。
R 软件特色
环境一词旨在将其描述为一个完整计划的,连贯的系统
而不是像其他数据分析软件那样经常增加非常具体且不灵活的工具。
R与S一样,都是围绕一种真正的计算机语言设计的,它允许用户通过定义新功能来添加其他功能。
系统的大部分本身是用S的R语言编写的,这使用户可以轻松地遵循所选择的算法。
对于计算量大的任务,可以在运行时链接和调用C,C ++和Fortran代码。
高级用户可以编写C代码来直接纵R对象。
许多用户将R视为统计系统。我们更喜欢将其视为实现统计技术的环境。
R可以通过package扩展(轻松)。
R发行版提供了大约八种软件包
并且CRAN系列Internet网站还提供了更多软件包,涵盖了非常广泛的现代统计数据。
R有自己的类似LaTeX的文档格式,可用于提供全面的文档
既可以在线使用多种格式,也可以使用硬拷贝。
R 安装步骤
1、用户可以点击本网站提供的下载路径下载得到对应的程序安装包
2、只需要使用解压功能将压缩包打开,双击主程序即可进行安装,弹出程序安装界面
3、同意上述协议条款,继续安装应用程序,点击同意按钮即可
4、可以根据自己的需要点击浏览按钮将应用程序的安装路径进行更改
5、弹出以下界面,用户可以直接使用鼠标点击下一步按钮
6、桌面快捷键的创建可以根据用户的需要进行创建,也可以不创建
7、现在准备安装主程序,点击安装按钮开始安装
8、弹出应用程序安装进度条加载界面,只需要等待加载完成即可
9、根据提示点击安装,弹出程序安装完成界面,点击完成按钮即可
R 使用教程
除非要完全从ASCII导入文件,否则通常需要知道其编码方式。
对于文本文件,一种了解其结构的好方法是file 命令行工具(对于Windows,包含在中Rtools)。
这报告类似
text.Rd:UTF-8 Unicode英文文本
text2.dat:ISO-8859英文文本
text3.dat:小尾数UTF-16 Unicode英文字符数据,
带CRLF线路终端器
int.dat:UTF-8 Unicode文本
int.dat:UTF-8 Unicode(带有BOM)文本
包括macOS在内的类似Unix的现代系统很可能会产生UTF-8文件。
Windows可能会生成所谓的“ Unicode”文件(UCS-2LE或者可能是UTF-16LE1)。
否则,除非来自中文/文/韩文区域设置(通常使用多种编码),否则大多数文件将采用8位编码。
无法确定自动检测哪种8位编码(尽管可能file会猜测,并且可能像上面的示例中那样猜测)
因此您可能只需要向发起者询问一些线索(例如,“ Windows上的俄语” ')。
“ BOM”导致Unicode文件出现问题。在Unix世界中,很少使用BOM,而在Windows世界中
它们几乎总是用于UCS-2 / UTF-16文件,并且通常用于UTF-8文件。
该file实用程序甚至无法识别没有BOM的UCS-2文件
但是许多其他实用程序将拒绝读取具有BOM和IANA标准的文件,UTF-16LE 并UTF-16BE禁止使用该文件
我们经常被简化为使用命令行实用程序od或十六进制编辑器查看文件以进行编码。
请注意,这utf8不是有效的编码名称(UTF-8is)
并且macintosh是有时称为Mac Roman编码的最易移植的名称。
导出到文本文件
从R导出结果通常是一个争议较小的任务,但是仍然存在许多陷阱。
考虑到目标应用程序,并且文本文件通常是最方便的交换工具。
功能cat是导出数据的功能的基。
它带有一个file参数,该append参数允许通过对的连续调用来编写文本文件cat。
更好的方法是,打开一个file 要写入或附加的cat连接
将其连接到该连接,尤其是要多次执行此作close时。
最常见的任务是将矩阵或数据框写为数字矩形网格,并可能带有行和列标签。
这可以通过函数wte.table和来完成wte。
函数wte仅以指定的列数写出矩阵或向量(并转置矩阵)
功能wte.table更加方便,并且用行和列标签写出数据框(或可以强制转换为数据框的对象)。
将数据帧写到文本文件时,需要考虑许多问题。
精确
这些函数完成的大多数实数/复数转换都是全精度的
但是这些转换wte由的当前设置控制options(digits)。
要进行更多控制,请 format在数据帧上使用(可能逐列)。
其他一些系统要求行名(可能为空)条目
wte.table如果col.names=NA 指定了参数,则将提供该条目。Excel就是这样一种系统。
分隔器
在文件中使用的通用字段分隔符是逗号,因为在英语国家/地区中的任何字段都不太可能出现。
此类文件称为CSV(逗号分隔值)文件,包装函数wte.csv提供适当的默认值。
在某些语言环境中,逗号用作小数点(wte.table由设置 dec = ",")
并且CSV文件使用分号作为字段分隔符:wte.csv2用于适当的默认值。
CSV文件有一个IETF标准(强制使用逗号和CRLF行结尾,使用eol = "rn"),RFC4180
但实际上更重要的是文件可被其所针对的应用程序读取。
使用分号或制表符(sep = "t")可能是最安全的选择。
缺失值
默认情况下,缺少值输出为NA,但是可以通过参数更改na。
需要注意的是NaNs的视为 NA通过wte.table通过,但不能cat也不wte。
引用字符串
默认情况下,带引号的字符串(包括行和列的名称)。
参数quote控制是否引用字符和因子变量:某些程序
例如Mondansoftware,不接受带引号的字符串。
第二种是电子表格通常使用的转义形式。
编码方式
文本文件的编码中不包含元数据,因此对于非ASCII数据
该文件需要定位到打算读取该文件的应用程序。所有这些功能都可以写入一个连接,
该 连接允许为文件指定编码,并wte.table带有一个fileEncoding参数以简化此作。
困难的部分是知道要使用哪种文件编码。在Windows上使用,最好是用什么Windows调用统一
那是"UTF-16LE"。使用UTF-8是制作不会轻易与任何其他编码混淆的可移植文件的好方法
但是即使macOS应用程序也可能无法识别它们,而Windows应用程序则不太可能。
显然,Excel:mac 2004/8需要.csv使用"macman"编码文件(Mac OS的早期版本中使用的编码)。
wte.matx软件包M中的函数提供了用于写入矩阵的专用接口
可以选择将它们成块写入,从而减少内存使用。
可以使用sink将标准R输出转移到文件,从而捕获(可能是隐式的)pnt的输出 。
这通常不是最有效的路线,因此options(width)可能需要增加设置。
功能wte.foreign封装国外使用 wte.table产生一个文本文件,也写代码文件
将读取该文本文件到另一个统计软件包。目前出口到支持SAS,SPSS和Stata。
XML
从文本文件中读取数据时,用户有责任了解并指定用于创建该文件的约定
例如注释字符,是否存在标题行,值分隔符,缺失值的表示形式(以及等等)中的说明。
一种标记语言,不仅可以用来描述内容,而且可以用来描述内容的结构
可以使文件自我描述,因此无需向读取数据的软件提供这些详细。
可扩展标记语言(通常简称为 XML)可用于提供这种结构
不仅适用于标准数据集,还适用于更复杂的数据结构。
XML变得非常流行,并且正在成为通用数据标记和交换的标准。
不同社区正在使用它来描述地理数据,例如地图,图形显示,数学等。
XML提供了一种指定文件编码的方法,例如
尽管不需要它。
该XML包提供的一般设施读写XML R.包内的文件StatDataML上CRAN是一个例子建筑XML。
软件包xml2提供了libxml2 C库的另一个接口。
yaml是另一个用于构造文本数据的系统,其重点在于人类可读:yaml软件包支持该系统 。
近期热门