Lucene的查询过程是:首先在词典中查找每个Term,根据Term获得每个Term所存在的文档链表;然后根据查询条件对链表做交、并、差等操作,...
离线安装 Tensorflow docker pull tensorflow/tensorflow docker images 保存镜像到本地文...
TextRank是一种用于文本的基于图的排序算法。通过把文本分割成若干组成单元(句子),构建节点连接图,用句子之间的相似度作为边的权重,通过循环...
分段存储 在早期的全文检索中为整个文档集合建立了一个很大的倒排索引,并将其写入磁盘中,如果索引有更新,就需要重新全量创建一个索引来替换原来的索引...
Lucene是一种高性能、可伸缩的信息搜索(IR)库,在2000年开源,最初由鼎鼎大名的Doug Cutting开发,是基于Java实现的高性能...
用户表达的一类query通常符合某种模式,把具有相同模式的query归纳起来就变成一种模板的形式。使用模板来描述用户需求具有比较强的可控性,且准...
搜索引擎总是会把相关性高的内容显示在前面,相关性低的内容显示在后面。那么,搜索引擎是如何计算关键字和内容的相关性呢?这里介绍2种重要的权重度量方...
电脑是下围棋要做些什么 如何决定下一步是最优的,最原始的方法是这样的… 然后,悲剧了,搜索空间如宇宙星空 OK,来看看Alphago怎么搞的 关...
公平锁/非公平锁 可重入锁 独享锁/共享锁 互斥锁/读写锁 乐观锁/悲观锁 分段锁 偏向锁/轻量级锁/重量级锁 自旋锁 上面是很多锁的名词,这些...