导入所需包 打开文件 查看数据 &与 |或 !非%/%(整数除法) %%(求余) filter( ) 按值筛选观测arrange(...
导入所需包 打开文件 查看数据 &与 |或 !非%/%(整数除法) %%(求余) filter( ) 按值筛选观测arrange(...
导入所需包 install.packages("tidyverse")library(tidyverse) 绘图模板: ggplot(data = ) +<GEOM_FUN...
聚类:在数据中识别相似行的技术聚类与分类:区别数据有无标度聚类技术:K-MEANS,DBSCAN,OPTICS,etc 一、K-MEANS 随机选取K个对象作为初始的聚类中心...
LLE: Locally Linear Embedding,局部线性嵌入,属于流形学习(Manifold Learning)的一种,其假设数据在较小的局部是线性的,也就是说,...
考试重点1、线性回归:OLS思想(假设、参数估计、分布、拟合优度、马尔卡夫定理)多元线性回归:省略变量问题、共线性问题2、假设检验:参数含义、置信区间、解释参数含义3、非线性...
一、 t-SNE 非线性降维,计算数据集中每行与其他行的距离(默认为欧氏距离)转换为概率。PCA属于线性降维,不能解释复杂多项式之间的关系,t-SNE是根据t分布随机领域的嵌...
mean( ) ——均值abs( ) ——绝对值sqrt( ) ——求平方根vmedian( ) ——中位数sd( ) ——标准差var( ) ——方差n( ) —— 计数s...
准备 ①导入文件查看默认存储路径,再将csv文档存入文件夹打开:(使用逗号作为小数点、分号作为字段分隔符的地区中使用csv2) getwd()read.csv("titani...
【概念】 分类:根据一些给定的已知类别标号的样本,训练某种学习机器,使其能够对未知类别的样本进行分类。属于监督学习。聚类:事先不知道任何样本的类别符号,通过算法将未知类别的样...
准备工作 ①R需更新至最新版:先在RGui中更新,再在R中点击工具栏Tools→Global Options→Change选择刚刚安装好的新版本R。 install.pack...
library(tidyverse) ①tibble()函数,使用向量会自动重复长度为1的输入,并可以使用刚刚创建的新变量; *tibble(x=1:5,y=1,z=x^2+...