概述 2019 年是大数据实时计算领域最不平凡的一年,2019 年 1 月阿里巴巴 Blink (内部的 Flink 分支版本)开源,大数据领域一夜间从 Spark 独步天下...
我是LakeShen,专注大数据技术分享,程序员经验分享,互联网科技分享。如果我的文章对你有帮助,希望你能点赞或者关注我,你的鼓励,就是我前进的最大动力。关注就完事了。 前言...
序 本文主要分析一个频繁GC (Allocation Failure)及young gc时间过长的case。 症状 gc throughput percent逐步下降,从一般...
缘由:前段时间只是看了小强的视频,跟着视频做一些实验,这种学习方式总会给人一种 ‘我学的是假Jmeter’ 的错觉,这周有个项目需要做压力测试,我便做个全程记录,以后自己用到...
什么是MySQL? MySQL 是一种关系型数据库,在Java企业级开发中非常常用,因为 MySQL 是开源免费的,并且方便扩展。阿里巴巴数据库系统也大量用到了 MySQL,...
前言 假设现在我们要向mysql插入500万条数据,如何实现高效快速的插入进去?暂时不考虑数据的获取、网络I/O、以及是否跨机操作,本文将在本地进行数据的插入,单纯从mysq...
概述 全称为Resilient Distributed Datasets,弹性分布式数据集,是Spark中最基本的数据(计算)抽象,它代表一个不可变,可分区,里面的元素可并行...
一、什么是HBase HBase是一个高可靠、高性能、面向列、可伸缩、实时读写的分布式存储系统,利用HBase技术可在廉价的PC Server上搭建大规模结构化存储集群。HB...
一、SQL执行顺序以及常见SQL的join查询 sql执行顺序: 手写 机读顺序 sql机器执行顺序sql机器执行顺序.png 七种join关系sql-join.png 二、...
推荐给大家10款好用的电脑软件,是我长期以来一直使用并且还会继续使用的软件,用起来足以提升效率,逼格高高! 1.DropIt 一款来自国外的开源、免费软件,主打 Window...