mengjiangxi - 简书

发简信

16
关注
3
粉丝
4
文章
1927

字数
10

收获喜欢
2

总资产

IP属地：北京

mengjiangxi

机器学习
工程师milter 编，-17 篇文章，1174 人关注
mengjiangxi

工程师milter
写了 57738 字，被 7104 人关注，获得了 2063 个喜欢

哔哩哔哩：李文举说

mengjiangxi

王树义
写了 532926 字，被 81243 人关注，获得了 12993 个喜欢

终身学习者、大学教师。稍微懂一点儿写作、演讲、Python和机器学习。欢迎微信关注并置顶我的公众号“玉树芝兰”(nkwangshuyi)。我已委托“维权骑士”（rightknights.com）为我的文章进行维权行动。
mengjiangxi

貌似2.0以后的版本都不需要partitionBy 了，hive建表的时候指定分区就可以，可以试试直接插入或用saveAsTable

Spark 写入数据到Hive分区表
0.登录hive数据库，这里采用beeline 1.创建数据库有两种方式，可以在hive客户端或beeline连接hive创建，也可以在spark中创建，以hive she...

mengjiangxi
19818 4 8
mengjiangxi

Spark 基础概念释义
1.RDD：弹性分布式数据集，弹性体现在可以在磁盘和内存间自由切换；基于lineage(血统)的容错；task失败特定次数重试；stage失败重试；数据分片的高度弹性（rep...

313 0 0
mengjiangxi

牛肉圆粉不加葱
写了 125404 字，被 1237 人关注，获得了 699 个喜欢

永不止步 Keep Moving
mengjiangxi

丹之
写了 7440 字，被 245 人关注，获得了 406 个喜欢

学习笔记总结<br><br>github:<a href="https://links.jianshu.com/go?to=https%3A%2F%2Fgithub.com%2Fxy2953396112" target="_blank">https://github.com/xy2953396112</a><br><br><br><br><br>

mengjiangxi

_云起
写了 49430 字，被 120 人关注，获得了 298 个喜欢

行到水穷处，坐看云起时<br>座右铭：Do not wait , just do it!
mengjiangxi

如何保证消息队列的高可用和幂等性以及数据丢失，顺序一致性
（1）RabbitMQ的高可用性 RabbitMQ是比较有代表性的，因为是基于主从做高可用性的，我们就以他为例子讲解第一种MQ的高可用性怎么实现。 rabbitmq有三种模式...

_云起
17644 8 102
mengjiangxi

和心数据
写了 54836 字，被 234 人关注，获得了 371 个喜欢

专注于大数据平台化、数据可观测性和数据可视化
mengjiangxi

Mongo、Redis、Memcached对比及知识总结
存储原理（持久化） MongoMongo的数据将会保存在底层文件系统，因此存储容量远大于redis和memcached。一个database中所有的collections以及...

AI生产力实战
3666 1 118
mengjiangxi

祝威廉
写了 263680 字，被 3533 人关注，获得了 2393 个喜欢

新博客地址： <a href="https://links.jianshu.com/go?to=https%3A%2F%2Fwww.zhihu.com%2Fpeople%2Fallwefantasy" target="_blank">https://www.zhihu.com/people/allwefantasy</a>

mengjiangxi

zhaif
写了 40419 字，被 60 人关注，获得了 73 个喜欢
mengjiangxi

编程界的小学生
写了 26142 字，被 744 人关注，获得了 964 个喜欢

什么都要会一点，这样装起逼来才不会尴尬。
mengjiangxi

Nignx 配置反向代理
解决问题：使用nignx完成http转https和二级域名转发，将已有http通信的web前端转为https,包括主域和一个二级域名，这两个domain解析到同一ip。Ngi...

1105 0 0
mengjiangxi

Ubuntu 更新python2.7版本至最新
系统自带的python2版本为python2.7.6，版本太低，需要更新至2.7最新，直接下载2.7.15更新后有各种问题，在此记录下整个过程。最后使用python源码安装，...

6727 0 2
mengjiangxi

Spark 写入数据到Hive分区表
0.登录hive数据库，这里采用beeline 1.创建数据库有两种方式，可以在hive客户端或beeline连接hive创建，也可以在spark中创建，以hive she...

19818 4 8

mengjiangxi

数据科学家
2453cf172ab4 编，195 篇文章，894 人关注

数据开发、数据分析、数据挖掘、算法研究、数据产品！

个人介绍

工作中最可贵的是学习持久力