d4df32736797 - 简书

发简信

d4df32736797

4
关注
0
粉丝
0
文章
0

字数
0

收获喜欢
1

总资产

IP属地：北京

d4df32736797

行业故事
简书编，2559 篇文章，149962 人关注

金融、互联、快消、广告、教育、媒体、物流、销售......这里有只有行业人才知道的行业故事。
d4df32736797

spark
jacksu在简书编，485 篇文章，1342 人关注

专注于spark相关内容分享，github相关资料整理：https://github.com/jacksu/utils4s

d4df32736797

《Spark指南》四、编程指引-Scala篇(上)
本文主要翻译至链接且不局限于该文内容，也加入了笔者实践内容，翻译水平有限，欢迎指正，转载请注明出处。概述每个Spark应用程序都包含了一个驱动程序，用于执行用户编写的ma...

Souloose
1392 0 5
d4df32736797

大数据应用案例：从立项到到落地实施全过程！
经历了多年的BI专题应用建设，有幸能在一个传统企业里探索大数据应用的建设过程，发现了很多不一样的地方，获得了不同的感受，在此以一个真实的案例的建设过程来品味其中的不同，也许能...

大圣众包
1869 0 7
d4df32736797

5种Python绘图库，轻松实现大数据可视化！
读图时代，图片不够精美绚丽，怎能够吸引住越来越挑剔的眼睛。而拥有“盛世美颜”的图片是怎样炼造而成的呢？大圣众包（www.dashengzb.cn）小编介绍5款交互式图表Pyt...

大圣众包
14048 0 26
d4df32736797

HBase 框架学习之路
1 背景知识 1.1 解决问题解决HDFS不支持单条记录的快速查找和更新的问题。 1.2 适用情况存在亿万条记录的数据库，只有千万或者百万条记录使用RDBMS更加合适确...

和心数据
3403 0 33
d4df32736797

Apache Sqoop - Overview（概述）
Apache Sqoop 概述使用Hadoop来分析和处理数据需要将数据加载到集群中并且将它和企业生产数据库中的其他数据进行结合处理。从生产系统加载大块数据到Hadoop中...

和心数据
1297 0 8

d4df32736797

玄月府的小妖在debug
写了 25056 字，被 113 人关注，获得了 207 个喜欢

知识没有边界，我只是想好好的了解这个世界。
d4df32736797

随机森林算法入门(python)
翻译自：http://blog.yhat.com/posts/python-random-forest.html 昨天收到yhat推送了一篇介绍随机森林算法的邮件，感觉作为介...

时空Drei
16247 13 100
d4df32736797

HBase架构详解和数据的读写流程
HBase架构图理解 HMaster链接Zookeeper的目得：HMaster需要知道哪些HRegionServere是活的及HRegionServer所在的位置，然后管理...

心_的方向
14308 1 13
d4df32736797

MapReduce shuffle过程浅析
整个shuffle的流程图 Map Shuffle的作用以及相应的设置 partition过程：输入的<key,value>对经过map()处理后输出新的<key,value...

心_的方向
3242 2 6
d4df32736797

Hive文件存储格式
列式存储和行式存储上图左边为逻辑表，右边第一个为行式存储，第二个为列式存储。 ** 行存储的特点： **查询满足条件的一整行数据的时候，列存储则需要去每个聚集的字段找到对应...

心_的方向
11818 2 7

d4df32736797

Hive中表数据的导入导出和查询
Hive表数据的导入从本地导入 load data local inpath 'local_path' into table table_name; 从hdfs导入 loa...

心_的方向
2434 3 5
d4df32736797

SparkSQL操作RDD两种方式对比案例
前言 GitHub地址：https://github.com/guofei1219 背景统计新渠道进件数量 SparkSQL操作RDD两种方式对比 1.使用反射推断Sche...

MichaelFly
3226 0 5
d4df32736797

Pythoner集中营
Andrew_liu 编，871 篇文章，32402 人关注

Pythoner的集中营, 收集关于Python的各种知识教程. 推荐文章和系列阅读: 1. Python 零基础入门资料整理（更新版） http://www.jianshu.com/p/9c02dade7e90 2. Python 零基础入门资料整理 http://www.jianshu.com/p/5eee782b8627 3. Python 从入门到高手系列视频教程 http://www.jianshu.com/p/93085280e4a4 4. Python学习网络资源整理 http://www.jianshu.com/p/fe0e5a515696 5. Python爬虫学习系列专题 http://www.jianshu.com/notebooks/255245/latest 6. Python Django博客开发专题 http://www.jianshu.com/notebooks/293635/latest PS: 另招Python热心管理员
d4df32736797

机器学习与模式识别
JasonDing 编，233 篇文章，9628 人关注

机器学习算法关注机器学习，人工智能，数据挖掘，计算机视觉等相关领域的文章
d4df32736797

心_的方向
写了 31867 字，被 95 人关注，获得了 167 个喜欢

d4df32736797

心智万花筒
写了 30136 字，被 296 人关注，获得了 507 个喜欢

公众号：心智万花筒
d4df32736797

大数据
磊Ray 编，4876 篇文章，9809 人关注

大数据，收录大数据相关技术的文章。
d4df32736797

白菜青萝卜
写了 3913 字，被 17 人关注，获得了 73 个喜欢

吾日三省吾身