先分词 分词后的文本 使用SRILM生成arpa格式的语言模型 将语言模型转化为G.fst 使用fstdraw绘制pdf 上面文本的完整转化过程 arpa格式: 文本格式的G...
运行虚拟环境: 配置文件 config.yml language:'zh'代表中文,'en'代表英文policies:nlu和core模型训练的参数pipline :定义了从...
2020年10月7号,Rasa发布了Rasa Open Source 2.0。 这个版本标志着Rasa Open Source开发的一个里程碑,该版本包含了许多增强功能,这些...
tf.nn.conv2d 在TensorFlow中使用tf.nn.conv2d实现卷积操作,其格式如下: input: 指需要做卷积的输入图像(tensor),具有[batc...
之前的文章中谈到了机器学习项目中,要想使得使得机器学习模型进一步提升,我们必须使用到模型融合的技巧,今天我们就来谈谈模型融合中比较常见的一种方法——stacking。翻译成中...
今天记一次采用bert抽取句子向量的实战过程,主要是想感受一下bert抽取出来的句子特征向量是否真的具有不错的语义表达。 在此之前,我们来回顾一下,如果我们想拿到一个句子的特...
更好的阅读体验请跳转至样本不均衡之难易不均衡[https://xv44586.github.io/2020/10/14/focal-loss/] 上篇看样本下菜的FastBE...
利用深度学习做多分类在工业或是在科研环境中都是常见的任务。在科研环境下,无论是NLP、CV或是TTS系列任务,数据都是丰富且干净的。而在现实的工业环境中,数据问题常常成为困扰...
本文的灵感来自于A Visual Guide to Using BERT for the First Time,其作者为Jay Alammar,访问网址为:http://...
1 赛题理解 2 数据分析 3 词向量+机器学习模型 词向量:是文本表示成计算机能都计算的数字或向量的一般方法。将不定长文本转换到定长空间,是文本分类的第一步。 One-ho...