[PyTorch]中的随机mask以及根据句子的长度进行mask

new_empty是获取一个同样device和同样dtype的tensor，bernoulli_(p)是根据概率p产生0,1序列(p是0)，expand_as扩展到同一维度。

def drop_tokens(embeddings, word_dropout):
    batch, length, size = embeddings.size()
    mask = embeddings.new_empty(batch, length)
    mask = mask.bernoulli_(1 - word_dropout)
    embeddings = embeddings * mask.unsqueeze(-1).expand_as(embeddings).float()
    return embeddings, mask

sequence_mask，tensor.lt letter than所有小于的是true。

最后编辑于：2019.06.10 21:13:56

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

2018-06-11
mean to add the formatted="false" attribute?.[ 46% 47325/...
ProZoom阅读 2,736评论 0赞 3
rljs
rljs by sennchi Timeline of History Part One The Cognitiv...
sennchi阅读 7,499评论 0赞 10
tensorflow开发API
tensorflow开发API 架构 Modules app module: Generic entry poin...
sennchi阅读 1,403评论 0赞 2
《仙剑3》紫萱原来有这么多造型！哪一个最美呢？
童年的回忆《仙剑奇侠传3》中的一位大美人——女娲后人紫萱，小时候就觉得她超级美，而且每个造型都好好看啊，那么今天就...
深夜絮语阅读 2,162评论 0赞 0
《平行时空 | 手机》
余罪漫步在北方小城长治的街头，来这个地方已经有1年多了，为什么会来这儿呢？要从三年前说起，三年前的一件跨省贩毒大案...
L闷儿阅读 686评论 10赞 3

赞1赞

赞赏

手机看全文