经济学家们所说的无形之手,似乎在引导市场开发新的R包。12月份收录在CRAN的129个新包里面,有8个关于计算方法(下文均有介绍)。本文选摘了40个R包进行简单介绍,其余包大家可登录CRAN自行查看,希望有助于大家的学习,感谢大家对R语言中文社区的支持!
一. 计算方法
1.* alphashape3d* : 提供计算三维空间中有限点集的α形计算(凸包的泛化)的功能;
deGradInfer : 对基于自适应梯度匹配的常微分方程系统(ODE),提供有效的贝叶斯参数推导功能;
FixedPoint : 提供了寻找定点向量的算法,包括非线性积分方程的迭代过程(Anderson1965)、epsilon推算方法(Wynn 1962)、最小多项式方法 (Cabay & Jackson 1976)等内容;
grapherator : 针对单、多目标组合优化问题的研究,提供了用于逐步生成加权图的功能;
HMMEsolver : 在不计算矩阵逆的情况下,通过行运算实现亨德森(Henderson)混合模型方程的快速求解;
kexpmv : 提供从*EXPOKIT *中计算矩阵指数的功能;
sparseEigen : 提供了计算矩阵稀疏特征向量的方法,该矩阵的运行时间比现有方法低2~3个数量级;
Average Running Time
- TukeyRegion : 提供Tukey域的快速计算,同时给出了给定数据的Tukey深度函数的高级集合;
二. 数据
- mlbgameday : 提供针对Gameday数据的多核处理方法,该数据源自美国职业棒球大联盟高级媒体(http://gd2.mlb.com/components/game/mlb/);
robis : 在R环境下,提供海洋生物地理信息系统数据处理等功能(http://iobis.org);
seaaroundus : 提供获取美国相关海域鱼类捕获数据的功能(http://www.seaaroundus.org/);
tidyhydat : 提供了从加拿大数据中提取历史和国家实时“水文”数据的功能;
三. 机器学习
- afCEC : 实现主动函数交叉熵聚类,通过查找混合广义多元正态分布的参数,将N维数据划分成聚类,最优地近似数据在N维空间中的散射;
- dissever : 通过使用预测协变量和“caret”包训练的模型,实现粗网格映射到精细网格映射的空间缩放;
- mlapi : 提供R6抽象类,借助类似scikit-learn API的方式构建机器学习模型
(scikit-learn 是Python 编程语言的一个核心模块);
- Numero : 在基于视觉线索的复杂数据集中,实现了一个非监督的统计框架来定义子组;
- PPforest : 实现了基于监督分类的投影追踪森林算法;
qCBA : 实现了通过关联规则进行定量分类,可查看Kliegr (2017);
tfestimators : 为TensorFlow Estimators 实现一个接口(API),提供许多不同模型类型的实现,包括线性模型和深度神经网络等;
四. 科学计算
- ePCR : 提供基于集成方法的惩罚Cox回归框架(ePCR),其性能非常优异;
2.* simRVPedigree* : 提供模拟和操纵被确定为包含受罕见疾病影响的多个家庭成员的谱系的功能;
- theseus : 提供用于解释微生物群落组成数据的分析和可视化工具,特别是扩增子测序的数据;
五. 统计
1.* ForecastComb* : 在ForecastCombinations 和GeomComb软件包的用户界面下,提供基于几何和回归的预测组合方法;
hesim : 提供开发和分析健康经济模拟模型的功能,包括概率敏感性分析的随机抽样、个别患者模拟、成本效益分析等;
PlackettLuce : 对Plackett (1975) and* Luce* (1959)所构建的模型进行了泛化;
PUlasso : 利用套索或分组套索惩罚,实现一个有效的算法来解决低维或高维数据中的未标记问题;
recurse : 计算轨迹数据的重访度量标准,例如每个地点的重访次数,以及上次访问所花费的时间;
samplesizeCMH : 提供计算Cochran-Mantel-Haenszel测试的功效和样本量的函数,同时也可以处理概率、赔率、相对风险和优势比值的计算;
skimr : 提供在控制台上显示汇总统计信息的功能;
六. 时间序列
- OSTSC : 提供使用集成的增强结构保留过采样(ESPO)和自适应合成(ADASYN)方法,支持对不平衡的单变量时间序列分类数据进行过采样处理;
七. 工具
JuniperKernel : 针对R实现了Jupyter 内核,提供API用于访问Jupyter生态系统中的各类库,支持建立组件、绘图等其他操作;
labelVector : 支持应用于其他包的原子矢量标签;
ncmeta : 提供从NetCDF数据源提取元数据的功能;
RPostgres : 为PostgreSQL(开源关系型数据库)提供符合DBI标准的访问接口(API);
swatches : 提供读取和检查Adobe颜色(ACO)、GIMP调色(GPL)、OpenOffice调色板(SOC)文件和KDE调色板(颜色)文件的功能;
stylr : 在不改变用户格式习惯的情况下提供打印R代码的功能;
八. 可视化
- BioCircos.png : 实现基因组数据的交互式Circos类可视化,将遗传变异、基因组融合和畸变等信息映射到循环基因组;
- cubing : 提供可视化、动画、解决和分析魔方的功能;
说明:本文由黄小伟翻译,限于个人水平,错误之处难免,欢迎批评指正!