
1. 数据准备 2. rnn的实现 下面是rnn的正向传播的实现,输入为数据inputs和初始隐状态state,注意:inputs将时间维度提前...
注意:不要混淆 隐藏层(hidden layer)、隐状态(hidden state ,隐藏变量hidden variable)、隐式表示(la...
总结: Ⅰ 概率p(x):事件 x 发生的概率。 Ⅱ 惊喜度、信息量:事件x发生时产生的惊喜(或信息),在1/p(x)的基础上取对数,即 -lo...
我们已经将文本数据映射为词元,可以将这些词元视为一系列离散的观测,例如单词或字符。假设长度为𝑇的文本序列中的词元依次为𝑥1,𝑥2,…,𝑥𝑇。 于...
P217 1. 词元化 tokenize()将文本行列表(lines)作为输入,列表中的每个元素都是一个序列(如一个文本行)。每个文本序列又被拆...
p216 正则表达式 一、基础语法:字符与规则 1. 普通字符 直接匹配自身,比如 abc 会精准匹配字符串里的 "abc" 子串,像在 "xy...
注意1: 在训练时,每个批次的标准化仅与当前批次的均值和方差有关,与其他批次无关。在评估模式,才会用到running_mean和running_...
使用 TensorFlow 构建 ViT B-16 模型。 1. 引言 在计算机视觉任务中通常使用注意力机制对特征进行增强或者使用注意力机制替换...
八、二维傅里叶变换 定义 九、二维傅里叶变换 性质 十、频域滤波- 低频 十一、频域滤波- 高频 十二、频域滤波- 同态滤波