240 发简信
IP属地:上海
  • 一、分治法

    分治算法的主要思想是将原问题递归地分成若干个子问题,直到子问题满足边界条件,停止递归。将子问题逐个击破(一般是同种方法),将已经解决的子问题合并,最后,算法会层层合并得到原问...

  • 五、课后作业

    Question 1.1: Implement distinct_words [code] (2 points) Question 1.2: Implement comput...

  • 120
    四、ELMO、GPT、BERT

    1、ELMO ELMO由一层input层 和 两层双向LSTM 组合而成的,input层可看为embedding层,不过ELMO是通过字符卷积来得到embedding的,不是...

  • 120
    三、字词模型(Subword Model)

    Word-Level Model 前面学习的 word2vec 和 glove 基本上都是基于word单词作为基本单位的模型,这种方式虽然能够很好的对词 库中每一个词进行向量...

  • 120
    二、词向量和语义

    一、基于统计的词向量 基于统计的词向量目的是,希望通过低维稠密向量来表示词的含义,例如: 在上面三个句子中,比如对于like这个词,在三个句子中,其左右共出现2次I,1次de...

  • 120
    一、自然语言的初步了解和word2vec语言模型的学习

    1. 人类如何理解一个单词的含义?(How do we represent the meaning of a word?) 人类用单词、词组表示概念,运用单词、符号表示自己的...

  • 120
    五、模型集成

    集成学习方法 在机器学习中的集成学习可以在一定程度上提高预测精度,常见的集成学习方法有: Bagging,即Bootstrapping aggregation,其思想是在随机...

  • 120
    四、模型训练与验证

    为什么需要验证集 在模型的训练过程中,模型只能利用训练数据来进行训练,模型并不能接触到测试集上的样本。因此模型如果将训练集学的过好,模型就会记住训练样本的细节,导致模型在测试...

  • 120
    三、字符识别模型

    CNN介绍 卷积神经网络(简称CNN)是一类特殊的人工神经网络,是深度学习中重要的一个分支。CNN在很多领域都表现优异,精度和速度比传统计算学习算法高很多。特别是在计算机视觉...

  • 二、数据读取与数据扩增

    图像读取 在Python中有很多库可以完成数据读取的操作,比较常见的有Pillow和OpenCV。 Pillow是Python图像处理函式库(PIL)的一个分支。Pillow...

  • 120
    一、赛题理解

    赛题背景: 本次赛题是街道字符识别,以计算机视觉中字符识别为背景,要求选手预测街道字符编码。 赛题数据: 赛题数据收集自SVHN街道字符,并采用匿名采样处理,数据包括每张照片...