240 发简信
IP属地:陕西
  • 120
    Datawhale零基础入门NLP赛事 - Task3 基于机器学习的文本分类

    我们构建了基于词袋模型和TF-IDF的特征提取器,随后构建了岭回归的分类器,并通过更改其各项参数观察变化,最后,使用逻辑回归作为分类器,发现效果大不如岭回归分类器。 具体分析...

  • Datawhale零基础入门NLP赛事 - Task2 数据分析

    任务目标 通过pandas工具对数据进行分析,找出数据的分布和一般规律。主要考察三个问题: 赛题数据中,新闻文本的长度是多少? 赛题数据的类别分布是怎么样的,哪些类别比较多?...

  • 120
    Datawhale零基础入门NLP赛事 - Task1 赛题理解

    赛题理解 赛题名称:零基础入门NLP之新闻文本分类 赛题目标:通过这道赛题可以引导大家走入自然语言处理的世界,带大家接触NLP的预处理、模型构建和模型训练等知识点。 赛题任务...

  • 这么多阅读量,详解???

  • 120
    cs224n-笔记-lecture13-contextual-representations

    之前的 Word Representation 方法如 Word2Vec, GloVe, fastText 等对每个单词仅有一种表示,而通常单词的含义依赖于其上下文会有所不同...

  • 120
    cs224n-笔记-lecture12-subwords

    目录 字符级模型介绍 Subword-models: Byte Pair Encoding and friends 混合了字符和单词的模型(介于二者之间) fasttext ...

  • 120
    cs224n-笔记-lecture02-word senses

    目录 单词向量和word2vec 优化基础 我们能否通过计数更有效地抓住这一本质? GloVe模型 评估词向量 词义(word sences) 单词向量和word2vec w...

  • 120
    cs224n-笔记-lecture01-wordvecs

    目录 人类语言和词语含义 词向量 Word2Vec语言模型介绍 优化方法:梯度下降法 人类语言和词语含义 1.如何表示一个词 定义词语的meaning: 用单词、词组表示概念...