本熊本 - 简书

发简信

本熊本

4
关注
5
粉丝
8
文章
9898

字数
10

收获喜欢
1

总资产

IP属地：北京

本熊本

浅谈MySQL的B树索引与索引优化
MySQL的MyISAM、InnoDB引擎默认均使用B+树索引（查询时都显示为“BTREE”），本文讨论两个问题：为什么MySQL等主流数据库选择B+树的索引结构？如何基...

猴子007
6286 5 55
本熊本

从cart决策树到XGBoost
一. cart决策树简述我们知道决策树算法有ID3、C4.5和cart三种，ID3和C4.5是基于信息增益和信息增益比率做特征选择的，存在大量的log对数运算，而且只支持分...

1856 0 0

本熊本

Flask+gunicorn+nginx部署python
1. 目标由于Flask是一个轻量级的Web框架，自带app.run()方法能够提供http接口服务，测试环境下测试非常方便，但是如果在生产环境上单纯使用Flask还是会有...

7203 2 4
本熊本

@烫烫烫烫烫烫烫烫烫烫_58e4 用的还是该类下全部样本向量的均值

大量短文本聚类效果优化：余弦相似度，Spark，Mini Batch Kmeans
1. 背景 1.1 问题概述有10万+条短文本，均是用户反馈的问题（每条文本长度大概在200字左右），需要对这些文本进行主题聚类，看下用户反馈的问题都集中在哪些方面。 1....

本熊本
9427 3 4
本熊本

Spark2.0.0与Elasticsearch6.5的jar包冲突问题
1. 问题在工作中，多次遇到了jar包冲突的情况，就以这个为例，整理下解决思路。现有某Spark程序，从Elasticsearch中读取数据进行后续的各种分析。当Spar...

1854 0 0
本熊本

spark程序jar与spark lib jar冲突，加载顺序
用户编写的spark程序打包成jar后提交到yarn执行时，经常会遇到jar包中明显存在某个类，但任务提交到yarn运行时却找不到类或方法（java.lang.NoSuchM...

westfire
14867 3 7
本熊本

大量短文本聚类效果优化：余弦相似度，Spark，Mini Batch Kmeans
1. 背景 1.1 问题概述有10万+条短文本，均是用户反馈的问题（每条文本长度大概在200字左右），需要对这些文本进行主题聚类，看下用户反馈的问题都集中在哪些方面。 1....

9427 3 4

本熊本

【火炉炼AI】机器学习011-分类模型的评估：准确率，精确率，召回率，F1值
【火炉炼AI】机器学习011-分类模型的评估：准确率，精确率，召回率，F1值 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scik...

科技老丁哥
9244 8 15
本熊本

采用栈解析包含&|()的关键词规则表达式
1. 需求例如用户给定一个包含与或关系的关键词匹配规则： (G20&中国&(互联网|人工智能|AI)&(腾讯|阿里|阿里巴巴|百度|京东)) 需要基于这个规则采集相关信息，...

641 0 0
本熊本

心蓝彩铅训练营第二期
心蓝丫头编，352 篇文章，423 人关注

心蓝彩铅训练营第二期学员作业收集,展示与点评。请严格按照规定格式交作业哦~~
本熊本

艺绘室手绘
艺绘室编，18245 篇文章，4541 人关注

◆欢迎投稿手绘作品，内容不限，与手绘无关内容不收录。 ◆【彩铅画】专题微信公众号：艺绘室。推送绘画教程，手绘素材，免费手绘训练营 ◆参加免费手绘训练营，手绘交流群，关注微信公众号：艺绘室，回复【公开课】，免费领取视频手绘课程
本熊本

手绘
南溪编，24519 篇文章，6601 人关注

简书手绘汇总，素描，彩铅，水彩，油画，插画，作品鉴赏，等等；手绘之家，望穿秋水等你来！手绘学习方法，心得，成长经验分享，手绘干货等等！（建议字数500加）专题内手绘达人们，会抽空挑选作品为大家点评，也可以留言请教，手绘是一家，么么哒! 手绘专题有学习交流微信群，可以添加主编南溪微信:hu18037508209进入；大家一起守护纯净的手绘空间，广告外链慎投!

本熊本

手绘新达人
Ann苳杭杭编，25779 篇文章，3290 人关注

零基础学手绘，彩铅，马克笔，水彩，素描，禅绕画…让你30分钟拿出一幅满意的作品！接收所有跟艺术和美有关的投稿。每天一幅画，进步非常大！让我们拿起笔来画画，只要拿起笔，就不算晚。
本熊本

彩铅画
椛纨编，1188 篇文章，781 人关注

简单又漂亮的彩铅画都能来到这里！
本熊本

绘画
小彤花园编，25410 篇文章，3515 人关注

公喜欢建筑画，彩铅，动漫，插画~~~（一堆废话www）个人爱好，小画也喜欢
本熊本

4b4733df6101
写了 0 字，被 1 人关注，获得了 1 个喜欢
本熊本

SimHash文档去重
1. 首先SimHash的算法生成图如下图所示：生成步骤如下：对于每篇文章，选择分词作为该篇文章的特征，获取去掉噪音的词做为文档特征，为每个词赋予一个权重，该权重可以使用...

832 0 0 1

本熊本

TF-IDF笔记
1. TFIDF介绍 1.1 基本概念 TF(Term Frequency)：代表词频，表示词在某篇文章中出现的频次，一般情况下词频越大，代表该词在本篇文章中重要度比较高（此...

2798 0 1 2
本熊本

TensorFlow从0到N
袁承兴编，30 篇文章，1269 人关注

我以官方文档为主线，开始对TensorFlow的学习。这期间会把我的理解进行持续的输出，作为《TensorFlow从0到N》系列。它不会止于翻译和笔记，不会停留在语言和工具，而是坚持通过启发性的方式，循序渐进的构建理解，搭建一个坚实可靠的、连接“零基础”与“人工智能（AI）/机器学习（Machine Learning）/深度学习（Deep Learning）”领域之间的缓坡道。
本熊本

我是如何从一个英语哑巴成为英语达人的
我的职业生涯有几次重要的转折和机遇，现在想来很大程度上都是沾了英语好的光。第一次就是大学毕业的第一份正式工作。当时同时拿到了A公司和另外一家知名日企的offer，两家公司的...

孙帮主
5536 50 248