240 发简信
IP属地:浙江
  • Task06:基于深度学习的文本分类3-BERT

    微调将最后一层的第一个token即[CLS]的隐藏向量作为句子的表示,然后输入到softmax层进行分类。 Output:

  • Task04:基于深度学习的文本分类1-fastText

    基于FastText的文本分类 step1.转换为FastText需要的格式 step2.FastText分类 Output: test:增加样...

  • Task03:基于机器学习的文本分类

    1. One-Hot 2. 词袋 Bag of Words(词袋表示),也称为Count Vectors,每个文档的字/词可以使用其出现次数来进...

  • Task02: 数据读取与数据分析

    教案实践 step1.数据读取 step2.数据探索 2-1.句子长度分析 Output: 对新闻句子的统计可以得出,每个句子平均由872个字符...

  • Task01:赛题理解

    赛题数据 赛题以匿名处理后的新闻数据为赛题数据,数据集报名后可见并可下载。赛题数据为新闻文本,并按照字符级别进行匿名处理。整合划分出14个候选分...