240 发简信
IP属地:江苏
  • 120
    机器学习基础(11)条件随机场的理解及BI-LSTM+CRF实战

    在NLP领域,在神经网络兴起之前,条件随机场(CRF)一直是作为主力模型的存在,就算是在RNN系(包括BERT系)的模型兴起之后,也通常会在模型的最后添加一个CRF层,以提高...

  • 120
    面向取证产品智能客服问答系统的命名实体识别模块

    介绍一下项目(不同于通常的时间、地点、组织机构命名实体识别,我们这个项目是有难度的,比如盗窃手段,采用方案等等偏语义层面) 项目介绍:从语料中准确识别命名性的指称项,如作案时...

  • 120
    文本分类总结

    一、给定需求下,判断使用哪个模型进行文本分类。 1、 首先判断是线上环境还是离线环境?(线上环境指,模型放到线上,有实时要求,要小于50ms,一般40ms左右) 离线环境...

  • 决策树

    决策树:机器学习一种具有树状结构的算法,树中每个内部节点表示一个属性的判断,每个分支代表一个判断结果的输出,最后每个叶节点表示一种分类的结果。 优点:可视化,直观;易于追溯和...

  • SVM

    支持向量机:监督学习,二分类算法,线性分类器。 假设数据线性可分,svm找到合适的决策分界面和边界分界面,将两个类别最大限度区分开来。SVM尽可能保证分类的正确性;尽可能加大...

  • 随机森林

    随机森林:是一种集成学习,由多个弱监督模型组成,每个弱监督模型在某个方向表现比较好。 随机森林是通过集成学习的思想,将多棵决策树进行集成的算法。对于分类问题,其输出的类别是由...

  • 120
    TextCNN

    textcnn一般用于文本分类。 1、TextCNN的网络结构 (1)embedding层,嵌入层 嵌入层使用word2vec或者glove(无监督)训练好的词向量,一般不用...

  • 线性回归和逻辑回归

    一、线性回归1、线性回归假设目标值与标签之间是线性关系,采用最小二乘法(MSE均方差)找到一个最好的模型来拟合数据。y=wx+b. 损失函数: 线性回归就是要找一条直线,并且...

  • 什么是语言模型

    1.什么是语言模型? 语言模型是描述自然语言概率分布的模型,是一个非常基础和重要的自然语言处理任务。利用语言模型,可以计算一个词或者一句话的概率,也可以在给定上下文的条件下,...

  • HMM隐马尔可夫模型

    一、HMM是概率图模型的一种,属于生成模型。HMM模型描述的就是从隐状态生成可观测状态的过程。 HMM有两个基本假设:1、马尔科夫假设:第t个隐状态(实体标签)只和前一时刻的...

  • fasttext笔记

    fasttext用于训练词向量和文本分类。fasttext采用c-bow模型,融合了词的n-gram和subword信息,并采用了层序softmax和负采样进行加速。 fas...

  • word2vec笔记

    1、word2vec的输入输出是什么? 输入是由onehot编码组成的句子,输出是每个词的概率。总共包含三层,输入层,隐藏层,输出层,全是做的全连接 输入层维度(T,V),隐...