好久没更新了,由于疫情的原因,家里的工作一直比较忙,最近闲下来了,学校也还没开学,正好趁着这段时间,复习一下前段时间的知识,泰坦尼克号的案例在数...
这里我们用FAO(Food and Agriculture Organization)组织提供的数据集,练习一下如何利用python进行探索性数...
一、简介 ARIMA模型(Autoregressive Integrated Moving Average model),差分整合移动平均自回归...
数据分析经常会遇到带有时间序列的数据,接下来我们看一下,利用pandas如何处理这类数据。 时间序列 时间戳(timestamp) 固定周期(p...
一、简介 EM算法 最大期望算法(Expectation-maximization algorithm,简称EM,又译期望最大化算法)在统计中被...
一、简介 Xgboost(extreme Gradient Boosting,极端梯度提升)经常被用在一些比赛中,效果显著。它是大规模并行的bo...
一、简介 它的目的是寻找一个超平面来对样本进行分割,分割的原理则是间隔最大化,最终转化为一个凸二次规划问题来求解,由简至繁的模型包括: 当训练样...
一、算法简介 主成分分析(Principal Component Analysis,简称PCA)算法是降维中最常用的一种手段,降维的算法还有很多...
一、算法简介 1、监督学习和非监督学习 监督学习 监督学习是根据已有的数据集,知道输入和输出结果之间的关系。根据这种已知的关系,训练得到一个最优...