作者:Joseph Rickert
翻译:黄小伟,先后从事游戏、社交及金融数据研究及应用,目前就职杭州有赞
9月份,共有126个R新包收录于CRAN(8月份收录R新包160个),增幅连续下降,当然,这是R包经历过数量上快速增长后的正常变化。本期选摘了其中40个R新包,针对其主要功能做简单介绍,便于大家学习。包含八个类别:数据、金融、机器学习、科学、统计学、时间序列、工具和可视化,其中工具类R包将做重点介绍.
一. 数据
trigpoints : 提供British National Grid(OSGB36)坐标参考系统中历史GB标志点(帮助地图制作者和徒步旅行者的固定测量点)的完整数据集.
UKgrid : 提供自2011年以来英国国家电网需求数据(高压电力传输网络).
二. 金融
- jubilee : 实现了Jubilee-Tectonic长期预测模型,用于预测美国股市的未来回报、国债收益率和黄金价格. ---量化同学可重点关注
- portsort : 支持通过条件或无条件排序,将资产分类为最多三个因子的投资组合.
三. 机器学习
crfsuite : 针对CRFsuite进行封装,允许用户拟合条件随机场模型。重点是自然语言处理、有命名实体识别、文本分块、词性标注、意图识别和分类模型.
ELMSO : 实现Paulson, Luo和James(2018) 中描述的算法,该算法在一组在线广告机会中进行预算分配的实现.
embed : 提供使用简单的广义线性模型、非线性模型将因子预测变量转换为一个或多个数值表示的函数.
newsmap : 实施地理文件分类的半监督模型,同时包含英语、德语、西班牙语、日语和俄语的种子词典.
splinetree : 提供使用样条投影方法构建回归树、随机森林的功能.
- stylest : 提供评价演讲者(作者)风格的独特性的功能.
四. 科学
- conStruct : 提供一种将遗传数据映射为离散层组合的方法,在每个离散层内,相关性可能随地理距离不断衰减.
- episcan : 提供一些有效的机制来扫描全基因组相互作用研究(GWIS)中的上位性,并支持病例对照状态(二元结果)和定量表型(连续结果)研究.
五.统计
- ahpsurvey : 实现层次分析过程,一个由Saaty(1987)引入的通用多准则决策工具,它允许决策者权衡属性并评估呈现给属性的备选方案.
empirical : 实现经验单变量概率密度函数(连续函数)和经验累积分布函数(阶梯函数或连续函数).
basisMCMCplots : 提供用于检查来自NIMBLE软件包接口的单链、多链后验MCMC样本的功能.
MetaStan : 提供使用Stan进行贝叶斯元分析的函数,包括二项式 - 正态分层模型、使用弱信息先验的异质性参数、治疗效果参数等选项.
Opt4PL : 提供获取和评估3、4和5种参数逻辑回归模型的各种最佳设计的功能.
rmatalog : 实现了metalog分布,这是一种现代的、高度灵活的、数据驱动的分布.
- rwavelet : 提供执行小波分析(正交和平移不变变换)的功能,同时进行数据压缩、去噪声.
samplingBigData : 提供对大数据集进行采样的方法,包括在多维空间中进行空间平衡采样.
survivalAnalysis : 实现高级接口封装以支持生存分析,包括Kaplan-Meier分析、对数秩检验、Cox回归.
- ungroup : 提供实现惩罚复合链路模型的功能,有效地估计粗略分箱数据的平滑分布.
六. 时间序列
- bayesdfa : 使用Stan实现贝叶斯动态因子分析,这是一种多变量时间序列的降维工具.
- tbrf : 提供基于日期和时间窗口的滚动统计函数,而不是n-滞后观察.
七. 工具
- atable : 提供创建临床试验报告、描述性统计和假设测试的功能,同时支持使用LaTeX或Word将结果排列在表中.
av : 实现与FFmpeg AV库的绑定,以便在R中处理音频和视频.
binb : 为RMarkdown中基于PDF的演示幻灯片提供一系列LaTeX样式.
broom.mixed : 将通过R中各种混合模型包拟合的对象转换为整洁的数据框格式.
codified : 允许作者使用元数据增加临床数据,以创建传统出版物、报告中使用的输出.
duawrangler : 允许对受保护元素的原始数据文件创建可共享数据集的功能.
ipc : 提供用于在R进程之间传递消息的工具,其中Shiny示例显示了如何执行有用的任务.
piggyback : 针对git的50MB提交限制,允许更大(最多2 GB)的数据文件附加到各个GitHub版本的存储库中.
pysd2r : 使用reticulate包实现pysd的交互接口,提供大量的pysd函数,并且支持以Vensim、mdl或xmile格式读取文件.
radix : 提供基于Radix阅读器友好排版,可视化的灵活布局选项以及对脚注和引文的完全支持来格式化Web的科学和技术文章的功能.
rbtc : 实现比特币的RPC-JSON API,并为区块链的地址创建和内容分析提供实用程序功能.
salty : 允许用户获取真实或模拟数据,并将其与常见的错误相结合,例如伪OCR错误、Unicode问题、带有荒谬标点符号的数字字段、错误日期等.
八. 可视化
- customLayout : 提供了graphics::layout()的扩展版本,允许用户通过组合更简单的布局为多个元素创建复杂的绘图区域.
- echarts4r : 允许用户通过利用Echarts 、JavaScript库创建交互式图表,它包括33种图表类型、动画等内容.
- ggparliament : 支持对议会的可视化,将选举结果可视化为建筑布局中的点.
- ggTimeSeries : 提供其他时间序列可视化,如日历热图、Steam Graph流图等.
说明:限于个人水平,错误之处难免,烦请批评指正,共同交流~