后端开发:【批量插入海量数据之Java插入MySql】解决方案

一、解析问题。

Java向MySql数据库插入万级记录时,采用的方案不同时执行速度会有所不同,数据量越大则优劣越明显。所以选取最优方案尤其重要,本文目前提供如下两种解决方案(不借用第三方框架或工具)。


二、解决问题。

1、方案一:循环逐条插入。

关键代码:

//DataModel 为自定义的数据模型类,dataList 即传入的即将要插入的数据集合;

public int insertData(List<DataModel> dataList) throws ClassNotFoundException, SQLException{

//开始计时;

Long begin = new Date().getTime();

//创建要执行的sql语句;

String sql = "insert into tb_ncdc values (?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?)";

/* 创建并获取JDBC连接类"Connection"的实例对象。(DBUtil类内为数据库访问的配置信息,需要自定义)*/

Connection connection = new DBUtil().getDbCon();

//PrepareStatement类存放每条记录对应的字段值;

PreparedStatement preparedStatement= connection.prepareStatement(sql);

for (int i = 0; i < dataList.size(); i ++) {

preparedStatement.clearParameters();

preparedStatement.setString(1, dataList.get(i).getSTN());

preparedStatement.setString(2, dataList.get(i).getWBAN());

preparedStatement.setString(3, dataList.get(i).getYEARMODA());

preparedStatement.setString(4, dataList.get(i).getTEMP());

preparedStatement.setString(5, dataList.get(i).getDEWP());

preparedStatement.setString(6, dataList.get(i).getSLP());

preparedStatement.setString(7, dataList.get(i).getSTP());

preparedStatement.setString(8, dataList.get(i).getVISIB());

preparedStatement.setString(9, dataList.get(i).getWDSP());

preparedStatement.setString(10, dataList.get(i).getMXSPD());

preparedStatement.setString(11, dataList.get(i).getGUST());

preparedStatement.setString(12, dataList.get(i).getMAX());

preparedStatement.setString(13, dataList.get(i).getMIN());

preparedStatement.setString(14, dataList.get(i).getPRCP());

preparedStatement.setString(15, dataList.get(i).getSNDP());

preparedStatement.setString(16, dataList.get(i).getFRSHTT());

preparedStatement.execute();

 }

/*如果autocommit=false时(默认为true,即自动提交事务)记得将本次事务提交,否则数据库里没有数据的;*/

//connection.commit();

//所有数据库操作结束后记得关闭连接,减少内存的占用;

preparedStatement.close();

connection.close();

// 结束时间

Long end = new Date().getTime();

//总 耗时

System.out.println("插入"+dataList.size()+"条数据的总时间为 : " + (end - begin)  + " ms");

return 1;

}

2、方案二:分批事务插入。

//DataModel 为自定义的数据模型类,dataList 即传入的即将要插入的数据集合;

public int insertData(List<DataModel> dataList) throws ClassNotFoundException, SQLException {

//设定每批、每次事务插入多少条数据;

int itemNum = 1000;

//开始时间;

Long begin = new Date().getTime();

// 创建sql前缀

String prefix = "INSERT INTO tb_ncdc VALUES ";

/* 创建并获取JDBC连接类"Connection"的实例对象。(DBUtil类内为数据库访问的配置信息,需要自定义) */

Connection connection = new DBUtil().getDbCon();

// PrepareStatement类存放每条记录对应的字段值;

PreparedStatement preparedStatement= connection.prepareStatement("");

// 创建sql后缀

StringBuffer suffix = new StringBuffer();

// 设置事务为非自动提交

connection.setAutoCommit(false);

//根据总的数据量计算需要分多少次事务插入;

int numTrans = dataList.size() / itemNum + 1;

//设定首次事务中的数据在集合中的索引为0;

int numData = 0;

//  外层循环,j代表提交事务次序;

for (int j = 1; j <= numTrans; j++) {

// 从索引numData开始查找总数为itemNum个数据,即为本批要插入的数据量;

for (int i = numData; i < numData + itemNum; i++) {

//判定如果是最后一批,可能会不足itemNum数量,则够数结束,防止数组越界;

if (i == dataList.size()) {

break;

}

// 构建sql后缀

suffix.append("('" + dataList.get(i).getSTN() + "','" + dataList.get(i).getWBAN() + "','"

+ dataList.get(i).getYEARMODA() + "','" + dataList.get(i).getTEMP() + "','"

+ dataList.get(i).getDEWP() + "','" + dataList.get(i).getSLP() + "','"

+ dataList.get(i).getSTP() + "','" + dataList.get(i).getVISIB() + "','"

+ dataList.get(i).getWDSP() + "','" + dataList.get(i).getMXSPD() + "','"

+ dataList.get(i).getGUST() + "','" + dataList.get(i).getMAX() + "','"

+ dataList.get(i).getMIN() + "','" + dataList.get(i).getPRCP() + "','"

+ dataList.get(i).getSNDP() + "','" + dataList.get(i).getFRSHTT() + "'),");

}

// 构建完整sql

String sql = prefix + suffix.substring(0, suffix.length() - 1);

// 添加sql批;

preparedStatement.addBatch(sql);

// 执行sql批;

preparedStatement.executeBatch();

// 提交本次事务

connection.commit();

// 清空上一次的sql后缀;

suffix = new StringBuffer();

numData += itemNum;

}

// 所有数据库操作结束后记得关闭连接,减少内存的占用;

preparedStatement.close();

connection.close();

// 结束时间

Long end = new Date().getTime();

// 耗时

System.out.println("插入" + dataList.size() + "条数据的总时间为 : "+ (end - begin) + " ms");

return 1;

}

三 、总结问题。

1.两种方案的主要区别在于,sql语句的不同、batch批和事务的使用。

单条插入sql语句:insert into Table (col1,col2...) values (val11,val12...);

多条批插入sql语句:insert intoTable (col1,col2...) values (val11,val12...),(val11,val12...),...;

2.本次测试的实例中,插入69万条数据左右,方案二要比方案一的速度快上10倍左右。具体测试得到的具体毫秒数可能不同。影响因素个人认为有如下几条:

    (1)数据模型,每条数据记录的字段越多,就需要调整itemNum(每批插入的数据量,可以采用二分法找到最合适的数值),或者调整MySql数据库对每次执行sql语句的字节长度限制(网上自行搜索)。itemNum值找到最合适的,速度才可能在其他条件同等的条件下是最快的;

    (2)主机配置。包括处理器性能、硬盘性能 ,mysql数据库可能也会影响到速度;

【本节Demo源码附带测试数据包及数据库脚本GitHub下载地址:

https://github.com/Breaker-93/Demo0929breaker_BatchInsertion.git

若有任何疑问,请留言。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,186评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,858评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,620评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,888评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,009评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,149评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,204评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,956评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,385评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,698评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,863评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,544评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,185评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,899评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,141评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,684评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,750评论 2 351

推荐阅读更多精彩内容

  • 1. Java基础部分 基础部分的顺序:基本语法,类相关的语法,内部类的语法,继承相关的语法,异常的语法,线程的语...
    子非鱼_t_阅读 31,604评论 18 399
  • 一. Java基础部分.................................................
    wy_sure阅读 3,807评论 0 11
  • 本人的环境为Myeclipse10、MySQL5.7.15 本文包括:简介JDBC编程步骤打通数据库程序详解—Dr...
    廖少少阅读 3,933评论 7 39
  • 本节介绍Statement接口及其子类PreparedStatement和CallableStatement。 它...
    zlb阅读 1,147评论 0 0
  • 最近,做了一件非常明智的事情,就是又开了一个公众号JudyBBS-2,专门分享精选育儿资讯,为各位宝妈服务。而将这...
    JudyBBS阅读 1,097评论 0 0