记录一下备用:使用https://github.com/hellohaptik/multi-task-NLP/[https://github.c...
数据集 RACE数据集 RACE: Large-scale ReAding Comprehension Dataset From Examina...
下载地址 https://www.cs.cmu.edu/~glai1/data/race/ 论文地址 Race: Large-scale rea...
下载地址 https://allenai.org/data/sciq 论文地址 Crowdsourcing multiple choice sc...
背景 相关前置背景知识见博客:https://www.jianshu.com/p/d11cb1fe1201 HMM三个问题回顾 1.状态问题:已...
集成学习 着重于在训练集上做文章:将训练集划分为各种子集或权重变换后用较弱的基模型拟合,然后综合若干个基模型的预测作为最终整体结果。 两种算法:...
支持向量机 最初用于解决线性问题,加入核方法后可以用于解决非线性问题。能适应“小样本数量、高特征维度”问题,甚至是特征维度大于样本数量的情况。目...
梯度下降 用于迭代求解函数最优解,是大数据领域用于求解问题的常用思想。步长:每一步梯度下降时向目标方向前进的长度。前期可以使用较大步长,加快训练...
线性回归 OLS、Ridge、Lasso的优缺点对比:OLS 最小二乘法:优点:计算方便(套入公式即可) 缺点:数据维度越高,参数值越大、更容易...