风驰电掣一瓜牛 - 简书

发简信

风驰电掣一瓜牛

0
关注
51
粉丝
22
文章
11701

字数
58

收获喜欢
2

总资产

IP属地：广东

风驰电掣一瓜牛

本身就是批量提取，你看用训练模型预测的命令行，输入文件可以是多篇文章，每一行对应一篇文章的json数据

关键词抽取工具包THUTag安装与使用
安装安装环境为64位Linux系统从github下载 THUTag 从官网下载 java8 解压 jre-8u131-linux-x64.tar.gz，将 jre1.8....

风驰电掣一瓜牛
1601 4 0
风驰电掣一瓜牛

搭配词抽取
参考：《Foundations of Statistical Natural Language Processing》第5章实现了两种方法：互信息和卡方测试，直观上看卡方...

974 0 0

风驰电掣一瓜牛

@喵_喵喵语言模型就是用来计算一个句子的概率的，具体应用可以看看机器翻译或者语音识别，比如在机器翻译中，翻译句子的概率 = 语言模型概率 * 翻译模型概率

TensorFlow 语言模型训练实战
实验1：PTB数据集实验教程: https://www.tensorflow.org/versions/r0.12/tutorials/recurrent/ 数据地址： h...

风驰电掣一瓜牛
5762 2 5
风驰电掣一瓜牛

深度学习经典模型
先挖坑，后面填。 CNN 参考： CS231n Convolutional Neural Networks for Visual Recognition 基于tensorfl...

757 0 0
风驰电掣一瓜牛

语义相似计算资料
文章 Sentence Embedding 干货 | NIPS 2015 Deep Learning Symposium(二）干货 | NIPS 2015 Deep Lea...

1897 0 5
风驰电掣一瓜牛

中文编码json数据操作（by Python）
现在有一个问题：通过json.loads()函数读取的数据是unicode的，后续没法处理。解决方法：通过json.loads函数中的object_hook参数指定解析方式...

529 0 0
风驰电掣一瓜牛

CentOS下gcc4.9编译安装教程
安装安装环境： CentOS 64位系统首先下载gcc安装包： gcc-4.9.2.tar.bz2 如上解压之后，执行./contrib/download_prerequ...

1927 0 0

风驰电掣一瓜牛

语言模型-计算句子概率
相关软件包： mitlm arpa mitlm只能训练语言模型，没有计算句子概率的函数，需要自己编写。但是mitlm可以输出arpa格式的语言模型文件，通过python包a...

4834 0 3
风驰电掣一瓜牛

DSSM: 深层结构语义模型
参考用于Sentence Embedding的DSSM与LSTM：管中窥豹学习记录一下深度语义匹配模型-DSSM Model DSSM on Tensorflow 代码:...

10137 0 3
风驰电掣一瓜牛

java编码的一个小坑
问题是这样的：当一行一行读取中文文件时，调用println输出的是乱码，将InputStreamReader设置为正确的编码还是不行代码如下：网上搜了老半天，终于找到原...

553 0 0
风驰电掣一瓜牛

python日志模块
目前有一种需求是启动一个server，记录每天的访问情况，查下了下资料，用python的logging模块可以实现。具体来说是使用TimedRotatingFileHand...

981 0 0
风驰电掣一瓜牛

TensorFlow训练词向量
参考： https://www.tensorflow.org/tutorials/word2vec 官网的这个教程主要讲word2vec的skip-gram模型，没有讲CBO...

11076 0 8

风驰电掣一瓜牛

词向量原理
了解词向量要从语言模型说起，语言模型其实就是计算任意一个句子的概率。经典的语言模型是n-gram模型，该模型假设每个词的生成仅仅依赖前面n个词，所以从大规模语料中统计每个词...

3106 0 2
风驰电掣一瓜牛

TensorFlow基础：共享变量
参考： https://www.tensorflow.org/programmers_guide/variable_scope 举例说明 TensorFlow中的变量一般就是...

17145 0 15
风驰电掣一瓜牛

孪生LSTM模型计算短语和句子相似性
孪生LSTM(Siamese LSTM)模型可以很容易来表征两个短语或者两个句子的相似性，输入数据是相似或不相似的短语对或句子对，输出是两个词语的相似性，对应的隐层可以视为词...

4003 0 5
风驰电掣一瓜牛

TensorFlow 安装小记
安装系统： Ubuntu 17.04 按照官网教程，有4种方法： virtualenv "native" pip Docker Anaconda 这里选择virtunale...

539 0 0
风驰电掣一瓜牛

基于gensim计算文档相似性
gensim 官网： https://radimrehurek.com/gensim/tutorial.html 训练tfidf, lsi, lda, doc2vec等4种模...

894 1 2

风驰电掣一瓜牛

TensorFlow seq2seq模型实战
中法翻译模型教程: https://www.tensorflow.org/versions/r0.12/tutorials/seq2seq/ 目标: 训练一个端到端的英语到...

14123 5 8

暂无个人介绍