240 发简信
IP属地:河南
  • 120
    几种信息熵的理解

    本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 之前对算法原理和推导写的比较多,评价指标、信息熵较少,补充下。 机器学习算法中经常会用到各种熵,如决策树、...

  • 120
    模型评价指标(CTR)

    本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 之前的文章没有对评价指标进行一个梳理,此小结补充一下建模过程中一些常用的评价指标。 最近项目在做点击率预估...

  • 120
    异常检测-One-Class SVM 单分类

    本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 (2)SVDD (one class SVM) SVDD的思路其实不难,基本思想是:既然只有一个class,...

  • 120
    异常检测-自编码

    本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 我们日常项目中经常会遇到数据不均衡的情况,这非常普遍,例如某动物分类项目的类别数量占比为300:100:9...

  • 120
    文本相似度之Sim_hash算法

    本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 最近项目有用到Sim_hash,做个简单记录。 Sim_hash是Google用来处理大量文本去重的算...

  • 主成分分析(PCA)

    本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 主成分分析(Principal Component Analysis,PCA)是中最常用的降维算法之一,...

  • 我这么理解的,因为L(wt)是向量v的反方向,所以v=-L(wt)。又因为v是单位向量,要除以摸

    梯度下降推导

    本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 梯度下降算法是机器学习、深度学习中更新模型参数最常用的算法,从公式上看,比较简单,只需要设定更新步长和计算一阶...

  • 120
    支持向量机推导

    本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 支持向量机(SVM)是算法工程师最耳熟能详的机器学习模型之一,这节对SVM作粗略的推导。 SVM旨在找到一...

  • 120
    DeepFM算法

    本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 FM通过对于每一位特征的隐变量内积来提取特征组合,最后的结果还不错,理论上FM可以对高阶特征组合进行建模,...

  • 120
    FFM算法

    本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 之前介绍了FM,接下来是它的改进版本FFM,加入了领域Field思想。在FM模型中,每一个特征会对应一个...

  • 120
    FM算法

    本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 在计算广告中使用逻辑回归等算法进行CTR(广告点击率)、CVR(转化率)等预估时,类别特征经过One hot...

  • 120
    异常检测小结

    本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 异常检测是指在一堆数据样本中,通过各种方法找出脱离正常范围的数据,即异常样本、异常数据。异常检测应用领域...

  • 120
    目标检测—SSD

    本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 近年来目标检测算法主要包括两种类型:One Stage和Two Stage。之前已经介绍了R-CNN、F...

  • 120
    Word2vec:Negative Sampling训练

    本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 Negative Sampling(负采样)其实理解起来不是很难,个人觉得比分层Softmax相对简单一...

  • 120
    Word2vec:Hierarchical Softmax训练

    本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 上一篇介绍了word2vec两种基础模型CBOW和Skip-gram的训练过程,但是我们发现这样可能会出...

  • 120
    Word2vec原理

    本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 看了许多网上word2vec的博客,感觉有点乱一大堆公式(可能我太菜了 0_0),花了两天自己整理了一下...

  • L1、L2正则推导

    本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 正则化是机器学习中常用解决过拟合,减低模型复杂程度的技术。方法比较简单就是在损失函数后添加惩罚项L1、L...

  • 120
    目标检测—Faster-RCNN

    本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 从之前Fast R-CNN文章的介绍中知道,它已经把很多工作集成到一个端对端CNN网络进行训练,但是依然存...

  • 120
    目标检测—Fast R-CNN

    本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。 Fast R-CNN建立在R-CNN和SPP的工作基础之上,使用了多种创新方法提升检测速度和准确率。 ...