点典 - 简书

发简信

点典

5
关注
2
粉丝
7
文章
1913

字数
0

收获喜欢
1

总资产

IP属地：天津

点典

@生而为人丶对不起 hive2以后，有这个功能，可以在hive-site.xml进行配置

hive基本操作之一
1.hive表中的基本数据类型 2,hive创建分区表 2.1内部表建表语句： create table table_name( Field1 string, ...

点典
3393 2 0
点典

BIGUFO
写了 37908 字，被 202 人关注，获得了 203 个喜欢

Github地址<br><a href="https://github.com/teeyog" rel="nofollow" target="_blank">https://github.com/teeyog</a>

点典

spark序列化问题
1.Spark的transformation操作为什么需要序列化？ Spark是分布式执行引擎，其核心抽象是弹性分布式数据集RDD，其代表了分布在不同节点的数据。Spark的...

2134 0 0
点典

hive优化
1. 2. 3.

254 0 0
点典

hive基本操作之二
1.查找数据到本地 insert overwrite local directory '/home/mydir/mydir' select .... 2.增加动态分区 s...

190 0 0
点典

hive基本操作之一
1.hive表中的基本数据类型 2,hive创建分区表 2.1内部表建表语句： create table table_name( Field1 string, ...

3393 2 0
点典

shell入门
awk sed grep expr let

233 0 0

点典

hive调优
1，参数调优 hive.map.aggr = true hive.groupby.skewindata =true 2,

115 0 0
点典

spark内核启动流程
1.，用户提交Application 2，启动Driver进程 3，注册Application 4，启动Executor 5，启动Task执行 6，Task执行完成

171 0 0
点典

kifile
写了 20387 字，被 137 人关注，获得了 57 个喜欢

有人需要 Java 分布式研发的吗，T_T
点典

终生学习丶
写了 45797 字，被 74 人关注，获得了 121 个喜欢

大数据.机器学习等
点典

spark
yodatech2016 编，5 篇文章，30 人关注

Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用并行框架，Spark，拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是Job中间输出结果可以保存在内存中，从而不再需要读写HDFS，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。

点典

Flume 1.7.0用户手册
介绍概述 Apache Flume是为有效收集聚合和移动大量来自不同源到中心数据存储而设计的可分布，可靠的，可用的系统。 Apache Flume的用途不仅限于日志数据聚合...

ximengchj
3525 0 13
点典

HIVE精讲
倾听内心的声音编，2 篇文章，3 人关注

hive学习
点典

技术极客TechBooster
erixhao 编，7 篇文章，242 人关注

技术极客，追逐热点技术，互联网技术，大数据。Apache, Hadoop, Hive, Spark, Solr, OpenStack,Docker, Kubernetes, Cassandra, Flume, HBase, Kafka, Mesos, Thrift, ZooKeeper, Spring Boot, Kylin etc.
点典

Hive在简书
咸鱼翻身记编，54 篇文章，252 人关注
点典

Sqoop使用笔记
[TOC] 最近在研究数据采集相关的知识，需要用到Sqoop把关系型数据库的数据导入到Hive里，这里记录下自己的使用心得，更多的是需要注意的地方。环境准备 OS: Mac...

纳尼2号
19056 11 23 1

点典

zookeeper
f4ab6291c5c8 编，3 篇文章，3 人关注

分布式
点典

zookeeper深入学习
纯洁的程序猿编，0 篇文章，1 人关注

工作中需要使用zookeeper，从0开始学习，与大家一同成长

暂无个人介绍