【Sentence-bert】 Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks 论文: http...
【Sentence-bert】 Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks 论文: http...
1.Constrained Deep Adaptive Clustering with Cluster Refinement 论文:https://ojs.aaai.org/...
1. GOLD: Improving Out-of-Scope Detection in Dialogues using Data Augmentation 论文:https...
1. Self-Guided Contrastive Learning for BERT Sentence Representations 论文:https://arxiv....
1.Exploiting Cloze Questions for Few Shot Text Classifification and Natural Language In...
错别字类型 1. 字形相似错误。 2. 拼音相似错误 3. 其他: 多字、少字、乱序 纠错难点 1. 需要一定的知识背景: 专有名词、人名等 2. 需要一定推理和分析能力 3...
Pycorrector实现文本纠错 代码: https://github.com/shibing624/pycorrector[https://github.com/shib...
SimCSE: Simple Contrastive Learning of Sentence Embeddings 摘要 论文利用对比学习获得更优的句子向量,不管是用无标签...
【BERT】问题 - 预训练与微调之间的不匹配问题,微调时从未看到[MASK] - 收敛速度慢: 每个batch中只预测了15%的token,导致收敛速度慢;换句话说,模型只...
摘要 BART是一个用来预训练seq-to-seq模型的去噪自编码器。它通过在输入序列中加入随机的噪声函数,并利用seq2seq结构从损坏的文本中重构原始文本来训练模型。BA...
摘要 Span extraction旨在从原始文本中抽取出一些文本span (如单词或短语)。引入标签信息(如实体的tag)有助于提升文本表示,可以将span extract...
本文档用于记录LINUX基本操作,方便自己以后快速查找定位。 文件读取命令 - ls 创建文件 - touch 复制文件 - cp 重命名文件(移动) - mv 删除文件 -...
本文用于指导SED操作用于处理文本文件,方便自己以后快速查找定位。 SED编辑器全称为流编辑器(stream editor),其主要特点为其只需对数据流进行一遍处理就可以完成...
本文用于理解ROC曲线的定义,绘制过程及其应用实现,主要用于自我温习回顾基础 基本目录如下: 什么是ROC曲线?1.1 ROC曲线的历史1.2 ROC曲线的定义1.3 ROC...
本文用于理解机器学习中常见的两种降维方法,主成分分析和线性判别分析,并对两者进行简单的对比。 基本目录如下: 什么是PCA?1.1 先导数学知识准备1.2 PCA基本概念理解...
本文主要用于理解主题模型LDA(Latent Dirichlet Allocation)其背后的数学原理及其推导过程。本菇力求用简单的推理来论证LDA背后复杂的数学知识,苦于...
本文主要用于记录谷歌发表于2014年的一篇神作(引用量上千),现已被广泛使用的Sequence to Sequence模型论文。方便初学者快速入门,以及自我回顾。 论文链接:...
本文主要用于记录发表于2014年的一篇神作(引用量破5k)。该论文第一次将注意力机制引入了NLP领域,而本笔记意在方便初学者快速入门,以及自我回顾。 论文链接:https:/...
本文主要用于记录发表于2015年的一篇神作(引用量上千)。该论文将注意力机制在机器翻译的领域进行了升级,而本笔记意在方便初学者快速入门,以及自我回顾。 论文链接:http:/...