登录注册写文章

MySql, 阿里云porlarDb的模糊检索、全文检索效率测试

MySql, 阿里云porlarDb的模糊检索、全文检索效率测试

测试环境：

本机Mysql，版本5.7.9， win10，中等配置笔记本电脑

阿里云porlarDb, 2核4G入门配置

测试表：

在本机和阿里云数据库中，都创建4个表,

test_fulltext_03、test_fulltext_04、test_fulltext_05、test_fulltext_06

表结构相同，都是id，province、name、content 4个varchar字段

测试数据准备

用java先生成300万行和500万行的两个文本文件，内容格式如下：

再使用 LOAD DATA命令导入表里（速度极快，300万行仅需1分钟），比如：

LOAD DATA LOCAL INFILE "d:/temp/data3.txt" INTO TABLE test_fulltext_03 FIELDS TERMINATED BY ',' LINES TERMINATED BY '\n';

表03和04都导入data3.txt， 300万行，

表05和06都导入data5.txt， 500万行

对表04和06的name和content字段加上全文检索索引：

CREATE fulltext INDEX index_name ON test_fulltext_04(name, content);

CREATE fulltext INDEX index_name ON test_fulltext_06(name, content);

添加后的状态

================ 本机Mysql 300万行性能测试 =====================

3.1：表03，直接用 like %%模糊匹配，检索前1000行

速度惊人，0.016秒

3.2：表03，直接用 like %%模糊匹配，检索第2000 - 3000行

0.234秒，可以看到时间明显增加

3.3：表03，直接用 like %%模糊匹配，检索第8000 - 9000行，2万- 2万1千行

可以看到耗时迅速变多

3.4：表03，直接用 like %%模糊匹配，检索条件匹配不到数据的情况

耗时4秒，可见like查询，时间和目标数据在什么位置有关

3.5：表03，直接用 like %%模糊匹配，统计目标记录数量

耗时也是4秒，可见统计数量很慢

3.6：表03，直接用 like %%模糊匹配，统计目标记录数量，条件找不到的情况

耗时3.8秒，还是慢

4.1：表04，使用全文索引进行匹配，检索前1000行

令人惊奇，0.59秒，比直接like的要慢的多

4.2：表04，使用全文索引进行匹配，检索前2000-3000行，8000-9000行，20000-21000行

时间也在增加，但是增幅较小，比较稳定。之前表03匹配2万-2万1千行，要2.3秒

4.2：表04，使用全文索引进行匹配，统计数量

这个耗时达到12秒，无法忍受的程度

4.3：表04，使用全文索引进行匹配，统计数量，匹配不到的情况

更慢的效果。。。

================ 阿里云PolarDb 300万行性能测试 =====================

阿里3.1：表03，直接用 like %%模糊匹配，检索前1000行

0.09秒，基本是网络传输耗时

阿里3.2：表03，直接用 like %%模糊匹配，检索第2000 - 3000行、8000-9000行，20000-21000行

时间增加的情况与本机mysql类似，性能基本持平

阿里3.3：表03，直接用 like %%模糊匹配，检索条件匹配不到数据的情况

耗时3秒，比本机快1秒

阿里3.4：表03，直接用 like %%模糊匹配，统计目标记录数量

耗时1.3秒，比本机的4秒快很多

阿里3.5：表03，直接用 like %%模糊匹配，统计目标记录数量，条件找不到的情况

耗时1.1秒，比本机的4秒快很多

阿里4.1：表04，使用全文索引进行匹配，检索1000行，处于不同位置的数据

速度和本机全文检索基本一致

阿里4.2：表04，使用全文索引进行匹配，统计数量

6秒7，虽然慢，但是比本机全文检索快很多（12秒）

阿里4.3：表04，使用全文索引进行匹配，统计数量，匹配不到的情况

3秒，比本机全文检索快很多（13秒）

================== 300万行测试的基本结论 ===========================

1：直接like查询，数据靠前时，速度很快，越靠后越慢

2：全文检索时，数据靠后带来的效率影响较小，性能更稳定

3：count数量比查询数据要慢的多，本机mysql 全文检索的count更慢

4：阿里polarDb的like查询，性能和本机基本一致，阿里like查询的统计数量，比本机要快的多

5：阿里polarDb的全文检索查询，性能和本机基本一致，统计数量比本机快得多

500万行数据的测试，方法和以上一致，只贴数据

5.1 本机，like查询

5.2本机，全文检索

5.1阿里，like查询

可以注意到，count(*)的效率远超本机

5.2阿里，全文检索

全文检索的 count(*)，效率也远超本机

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

mysql的全文检索
一、概述 MySQL全文检索是利用查询关键字和查询列内容之间的相关度进行检索，可以利用全文索引来提高匹配的速度。 ...
wshsdm阅读 480评论 0赞 0
三万字、91道MySQL面试题附PDF
数据库基础知识 1. 为什么要使用数据库数据保存在内存优点：存取速度快缺点：数据不能永久保存数据保存在文件...
Python百事通阅读 470评论 0赞 1

Sphinx 支持MYSQL等的全文检索工具
文主要介绍Sphinx的入门使用，新手观看，老鸟指正！ 1、简介 1.1.Sphinx是什么 1.2.Sphinx...
SkTj阅读 2,394评论 0赞 1
Mysql记录
数据库基础知识为什么要使用数据库数据保存在内存优点：存取速度快缺点：数据不能永久保存数据保存在文件 ...
carter记录阅读 618评论 0赞 0
Linux云计算-MySQL-表操作-索引-外键-视图
1 字段修饰符 (约束) 1.1 null 和 not null 修饰符我们通过这个例子来看看 [root@xu...
学神来啦阅读 602评论 0赞 1

友情链接更多精彩内容

赞1赞

赞赏

手机看全文