ML 简介 在ML问题中,当给定一批数据集,我们所要做的就是找到一个函数(或者一个分布),使得当给定一个新的输入X时,可以得出一个准确输出Y。在机器学习中,有三要素分别是:模...
ML 简介 在ML问题中,当给定一批数据集,我们所要做的就是找到一个函数(或者一个分布),使得当给定一个新的输入X时,可以得出一个准确输出Y。在机器学习中,有三要素分别是:模...
今天主要想写一下DeepLearning 中BatchNorm,文章主要主要的大纲为: BN 什么 为什么提出BN BN 的具体细节是什么 BN 的改进 BN数学表达式 BN...
对于做NLP的新人来说第一个接触到的模型大概就是RNN,RNN 应该算是NLP任务中Hello World了。对于业界一般说使用RNN指的的LSTM,而并非是RNN,因为LS...
在制作Docker 镜像时,很有可能会遇到下载速度慢,超时等情况,这种情况其实和Anaconda 超时的原因一样,都是由于需要从国外网站下载执行镜像。类似Anaconda加速...
Anaconda 对于做数据挖掘的同学说是一个非常重要的工具包,其中包括了很多数据挖掘工具,但是Anaconda默认下载是从国外下载,一般情况是非常慢的这让很对同学很是痛苦啊...
随着数据挖掘和人工智能的兴起,Python语言逐渐火爆起来,鉴于现在大量流式数据,Python作为一门热门语言自然要对接Kafka。 依赖包安装 Python如果要接入kaf...
Transformer 模型是谷歌大脑在2017年发表论文 《Attention is all you need 》中所提出的 Seq2Seq 模型。 为什么要使用Trans...
Transformer-XL是为了解决Transformer 对于Long-term 依赖问题而提出来了,那么Transformer对于Long-term dependenc...
wordvector NLP 任务中最基本的运算单元应该是词了,处理的所有词组成在一起就行成了词库,但是词库是稀疏的,所以我们需要将词转换成计算所熟知的实数,这种表示方式就是...
很多时候数据量大了,特别是有几亿条数据的时候,可能你会懵逼的发现,跑个搜索怎么一下 5~10s,坑爹了。 第一次搜索的时候,是 5~10s,后面反而就快了,可能就几百毫秒。 ...
ES如何处理并发问题 其实这个问题问的是悲观锁和乐观锁,以及在ES中的应用 悲观锁 悲观锁就是只要操作就加锁(不太严谨),比如线程A读取数据,则线程A此时就对A进行加锁,知道...
如何理解ES是分布式、可伸缩、高可用 ES 是基于Lucene实现的分布式搜索引擎,其目的是扩展单机性能问题 ES 可以横向或者纵向扩展,一般都选择横向扩展,这样性价比更好,...
特征分解 概念 特征分解是矩阵的分解的一种,目的是将一个矩阵拆分成几个矩阵乘积的形式,就好像是我们对标量(scalar)做因式分解一样。 目的 之所以要做特征分解,一方面是要...
多线程的目的 提到多线程就只有一个目录,更好的利用CPU资源,我们让CPU同时处理多个任务,缩短计算和处理时间。 在实现多线程之前,首先了解一个下多线程的一些概念: 多线程:...