R的安装、运行与基本操作
以下内容是我在R语言学习过程中的每一课的重点笔记记录。
02 数据分析
数据:是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些符号的组合。
通过数据分析的结果指导决策。
数据分析的一般步骤:
① 数据采集 ②数据存储 (存储于计算机文件,大量数据即数据库)③数据统计:使用统计方法,有目的的对收集到的数据进行分析处理,并解读分析结果(目标明确)。
④数据挖掘:Data Mining,又称为资料勘探、数据采矿,一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程(探索过程)。
⑤数据可视化:图形展示
⑥进行决策
03 数据挖掘
大数据分析的思维转变:
1.要分析与某事物相关的所有数据,而不是依靠分析少量的样本。
2.我们乐于接受数据的纷繁复杂,而不再追求精确性。
3.不再探求难以琢磨的因果关系,转而关注事物的相关关系。
05 R语言
R语言的前身为S语言,S语言可用S-PLUS软件实现。
R语言最开始的目的是为了生物统计与计算。
R语言的优点:
① 有效的数据处理与保存机制
② 拥有一整套数组与矩阵的操作运算符。
③ 一系列完整而又连贯的数据分析工具。
④ 图形统计可以对数据直接进行分析和显示,可用多种图形设备。
⑤ 一种相当完善、简洁和高效的程序设计语言。
⑥ R语言是彻底面向对象的统计编程语言。
⑦ R语言与其他编程语言、数据库之间有很好的的接口。
⑧ R语言是自由的软件,可以放心大胆使用,但其功能却不比其他同类软件差。
⑨ R语言具有丰富的网上资源(R语言官网:r-project.org)
R语言的缺点:
① R语言不够规范,不易上手,需要付出大量的学习成本。
② R的扩展包太多了,需利用较多的时间查找学习。
07 R的安装
R语言官网——点击Download下的CRAN——点击China,选其中任一镜像网站——点击Download R for Windows——点base,再点下载即可
08 R的运行
R的运行方式:①交互式 ②R脚本 ③R工作空间
交互式:>为命令提示符,换行时>切换为+表示继续输入,直至补齐括号
R脚本:后缀名为.R的文件
R工作空间,即建立一个Project,相当于建立一个文件夹
在R安装根目录下有一个Rproject.site的文件可以设置R语言默认程序选项,可加上:
.First(),打开包
.Last(),清理操作
09 Rstudio
Rstudio类似python的pycharm,一般在Rstudio中进行R语言数据分析
直接从国外官方网站下载速度太慢,可以从清华镜像下载:mirrors.tuna.tsinghua.edu.cn
在Rstudio中,注意以下:
① ctrl+Enter相当于Run运行按钮
② 上方的Source按钮相当于运行所有代码
③ 放大镜可以进行查找替换
④ Tab键可以自动补齐残缺的代码
⑤ 上方菜单栏里的Tools中Global Options 可以设置Appearance以设置主题外观,包括背景以及字体,字号等
⑥ Ctrl+键盘的向上箭头:可列出之前敲过的命令
⑦ Alt+shift+K:可以查找所有的快捷键
10. R语言基本操作
(1)getwd():查找工作目录
(2)setwd(dir=”C:/Users/Rdata/”):设置当前工作目录
注:在Windows中为“\”,R中为“/”
(3)list.files():可以查看目录下的文件 dir()也可完成同样的功能
(4)定义变量不可以以数字开头
R中的赋值符号为 <- ,而并非 =,用=赋值会出问题
此赋值符号可用键盘上的Alt加-输入
例子:y <- sum(1,2,3,4,5) 将1,2,3,4,5的总和值赋给变量y
5 -> x 将5向右赋值给x
X <<- 5 将5强行赋值给一个全局变量,而并非局部变量
(5)ls():列出当前所有的变量
(6)ls.str():列出当前每个变量的详细信息
(7)str(x):列出x变量的详细信息
(8)ls(all.names=TRUE):找出以.命名的所有文件,包括以.开头的
(9)rm(x)删除变量x
(10)rm(list=ls()):一次删除所有的变量
(11)history():可列出所有的历史记录
(12)history(5):只列出最近5条历史记录
(13)ctrl+L:清屏
(14)save.image():保存当前空间
(15)q()退出