R语言学习—— ggplot2函数
阿里云国内75折 回扣 微信号:monov8 |
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6 |
最近在自学R语言但是从纯粹的理论开始学习太慢了而且没有实操不太行所以目前是在实际应用中查漏补缺遇到什么临时学什么然后把笔记都一一记录下啦。分享出来一边是方便自己查找另一方面也是想方便和我一样入门的菜鸟哈哈哈这个系列将持续更新哦。其中有些图表来源于网络如有侵权联系可删 ~
目录
一、R语言介绍
- R语言对大小写比较敏感命名可以数字、字母和 . 以及 _ 开头但是如果以 . 开头那么后面不可以接数字。
- 基本命令要么是表达式要么就是赋值。
- 命令可以被 ; 隔开也可以直接跳到下一行。
- 基本命令可以通过大括弧{ }构成一个复合表达式。
- R的基本数据类型包括数值型numeric、字符型character、复数型complex、逻辑型logical对象类型有向量、因子、数组、矩阵、数据框、列表、时间序列。
二、快捷键
- 退出R程序q()
- 自动补全tab
- 清空consolectrl+L
- 中断当前计算ESC
- 执行代码 Ctrl+Enter 或者Run
- 查找Ctrl+F
- 保存Ctrl+S
- 撤销Ctrl+Z
- 恢复Ctrl+Y
- 删除整行Ctrl+D
- 批量选择alt
- 注释Ctrl+Shift+C
- 更新点击Update
- 查看某个包helppackage=“rpart”
- 设置断点browser( )或debug( )
- 加载R数据包require( )或library( )
- 重新运行上一段代码 Ctrl + Shift + P
- 执行整个文件 Ctrl + Shift + Enter
- 获取工作路径在Console中输入getwd( )
- 安装Package点击Install输入包名或者在Console中输入install.packages(' '
- 中文注释换乱码【Tools】→【Global Options...】→【Code】→【Saving】选择UTF-8.
- R中常用的符号
- R中常用的函数
二、R语言包的学习
一ggplot2
一款图形可视化的R包核心理念是将绘图与数据分离按图层作图其中图层包括三层——数据层、几何图形层和美学层有利于结构化思维同时保有命令式作图的调整函数使其更具灵活性绘制出来的图形美观同时避免繁琐细节。包含以下几个概念以下这些不同层之间都是使用“+”连接起来的也就是最终是以图层的形式进行叠加展示。
- 数据Data和映射Mapping:数据映到图像
- 标度Scale:数据取值映射到图形空间其中最主要的是图形属性aesthetic attributes,记作aes例如用颜色、大小、形状表示不同取值
- 几何对象Geometric Object,记作geom:统计图中看到的实际元素比如点、线、多边形等
- 统计变换Statistics Transformation,记作stats:对数据进行某种汇总如直方图或将二维关系用线性模型解释
- 坐标系统Coordinate System,记作coord:指的是数据如何映射到图形所在平面提供作图所需的坐标轴和网格线
- 图层Layer:将数据分解为子集进行联合展示
- 分面Facet:对所需的绘图操作进行一层一层叠加最终得到所需图形将绘图窗口分成若干个子窗口。
1、数据
在使用ggplot2的过程中接受的数据集必须是以data.frame格式的。
2、函数
1ggplot( )找到映射的对应关系data=数据集,新手训练的时候可以使用ggplot2中自带的mpg数据集进行练习。
2aes( )映射函数分别使用 x =(x轴坐标内容)
y =(y轴坐标内容)
制定需要映射的变量。
3geom_point ( )散点图绘制函数。
library(ggplot2)
ggplot(data=mpg,mapping=aes(x=cty,y=hwy))+geom_point()
这个地方的代码还可以拓展一下函数的变化还是非常灵活的。
比如按照年份这个变量变换颜色。
ggplot(data=mpg,mapping=aes(x=cty,y=hwy,color=factor(year)))+geom_point()
其实这里的"data=""x=""y="都可以省略同时试着把factor省略。另外这里的“color( )”放在ggplot( )中和geom_point( )中都是可以的两个代码的图都是一样的哦。
ggplot(mpg,mapping=aes(cty,hwy,color=year))+geom_point()
ggplot(mpg,mapping=aes(cty,hwy))+geom_point(aes(color=year))
4geom_histogram( )直方图绘制函数针对连续变量。
library(ggplot2)
ggplot(data=mpg,mapping=aes(x=hwy))+geom_histogram()
5geom_bar( )柱形图绘制函数也称柱形图针对离散变量。
6geom_density( )密度图绘制函数。
7geom_box( )箱线图绘制函数。
其他的一些几何对象变换可选。
8stat_smooth( )拟合曲线。
ggplot(mpg,mapping=aes(cty,hwy,color=year))+geom_point()+stat_smooth()
其他的统计变换函数可选。
9facet_wrap( )分面函数。
ggplot(mpg,mapping=aes(cty,hwy,color=year))+geom_point()+stat_smooth()+facet_warp(~year)
两张图在一行有点拥挤可以指定行和列。其中指定列使用ncol= 指定行用nrow= 。
ggplot(mpg,mapping=aes(cty,hwy,color=year))+geom_point()+stat_smooth()+facet_wrap(~year,ncol=1)
10主题函数 labs( )、xlab()、ylab()、theme( )
ggplot(mpg,mapping=aes(cty,hwy,color=year))+geom_point()+stat_smooth()+facet_wrap(~year,ncol=1)+labs(x='每加仑城市公路行驶距离',y='每加仑高速公路行驶距离',title='汽车油耗与型号')
再来调整一下标题的位置和美观程度。
ggplot(mpg,mapping=aes(cty,hwy,color=year))+geom_point()+stat_smooth()+facet_wrap(~year,ncol=1)+labs(x='每加仑城市公路行驶距离',y='每加仑高速公路行驶距离',title='汽车油耗与型号')+theme(plot.title = element_text(hjust = 0.5))
ggplot(mpg,mapping=aes(cty,hwy,color=year))+geom_point()+stat_smooth()+facet_wrap(~year,ncol=1)+labs(x='每加仑城市公路行驶距离',y='每加仑高速公路行驶距离',title='汽车油耗与型号')+theme_bw()+theme(plot.title = element_text(hjust = 0.5),panel.grid = element_blank())
同时ggplot2中提供很多可以直接使用的主题。比如theme_grey ()是默认主题theme_bw( )是白色背景主题theme_classic( )是经典主题。
三、知识点合集
一回归的种类
- 简单线性一个量化的解释变量预测一个量化的响应变量一个因变量、一个自变量
- 多项式一个量化的解释变量预测一个而量化的响应变量模型关系是n阶多项式一个预测变量但同时包含变量的幂
- 多元线性两个或多个解释变量预测多个相应变量
- Logistic一个或多个解释变量预测一个类别型变量
- 泊松一个或多个解释变量预测一个代表频数的响应变量
- Cox比例风险一个或多个解释变量预测一个事件发生的时间序列对误差项相关的时间序列数据建模
- 非线性一个或多个量化的解释变量预测一个量化的响应变量不过模型是非线性的
- 非参数一个或多个量化的解释变量预测一个量化的响应变量模型的形式源自数据形式不事先设定
- 稳健一个或多个量化的解释变量预测一个量化的响应变量能抵御强影响点的干扰
- OLS回归通过预测变量的加权和来预测量化的因变量其中权重使通过数据估计而得以的参数主要是使残差平方和最小。
- 用lm拟合回归模型格式是myfit <- lm(formula,data)formula指要拟合的模型形式data是一个数据框包含了用于拟合模型的数据formula形式如下Y~X1+X2+……+Xk ~左边为响应变量右边为各个预测变量预测变量之间用+符号分隔。