前言
关于redis,最近在b站看了一个比较全面的视频,并且与此同时打算做个笔记,为了更好的理解和以后的复习。ps:我看的视频是狂神说java中的一个系列。
这个视频我觉得最好的一点,也是up主说的我比较喜欢的一句话:知史明智。
redis我在工作中用了一年多了,其中get/set用的飞起,闭着眼睛都能写了的那种。五种数据类型也倒背如流,但是面试的时候经常被问卡住,因为稍微深一点的东西就不懂了,使用的话下载,安装,导入依赖,配置文件,get/set。说十分钟学会有点夸张,但是对着教程半小时怎么也会用了。但是会用不代表就懂了,就会redis了。初级程序员也都能用,有个名词角做javaAPI接口调用工程师,形象不形象?作为一个从业三年多的程序员,知其所以然才是根本。
下面开始一点点的整理知识。因为我这里是按照视频教程整理的,可能会有一定的个人色彩,比如我懂的或者我觉得不重要的可能会一笔带过,如果看了觉得不够不懂也建议你去看我说的视频源。
NoSQL概述
为什么要用NoSQL
1. 单机MySQL的年代
90年代,一个基本的网站访问量比较小,单个数据库完全足够,那个时候多是静态html,主要内容也是文字,服务器没有太大压力。
但是随着发展,出现了问题:
- 数据量太大,一个机器放不下。
- 数据的索引一个机器内存放不下。
-
访问量(读写混合)一个服务器承受不了。
2. Memcached(缓存)+读写分离+垂直拆分
因为网站百分之八十的情况都是在读,每次都去查询数据库就很麻烦而且没必要,所以使用缓存。缓存的作用就是在数据没有改动的前提下,可以直接从缓存中读取(spring中是有这个功能的,具体怎么实现的都可以,主要是这个思路)。
并且与此同时,刚刚都说了主要是读的时候多,当访问量过大一个服务器承受不了,可以采取读写分离的策略。打个比方:建立三个数据库,1,2,3。其中1,3用来读数据,2用来写数据。采用一定的方法让1,2,3的数据可以同步,这样就大大减少了对数据库的压力。
发展过程:
- 优化数据结构和算法
- 使用文件缓存(io操作,io缓存不能共享)
- Memcached出现(当时最热门的技术)
3. 分库分表+水平拆分+mysql集群
当读写分离垂直拆分还满足不了需求,那么分库分表出现了。其实这个是顺下来的一个思路:当单纯的读写分离满足不了需求,那么哪怕分库以后,也是有压力的,所以一定是每一个子库,也要做读写分离。主从复制。所以演变成了集群。
数据库的本质就是读和写,其实随着发展数据库自身也在不断优化,早些年用MyISAM,是表锁,十分影响效率,高并发下就会出现严重的锁问题。而现在一般用InnoDB,是行锁,性能大大提高了。
4. 如今最近的年代
近十年的技术发展,超过了前几千年。这是一个技术爆炸的时代。就连定位都是一种数据了。随着海量的多样的数据需求出现(比如热榜,实施排行,关系网等),mysql等关系型数据库已经不够用了,比如较大的文件,图片,博客等,存在mysql不合适,所以随着这种需求,出现了非关系型数据库,也就是NoSQL。(ps:为什么是非关系型:因为在大数据的压力下,再去修改表结构是件很难的事,比如一个用户表一亿条数据,现在这个表加一个字段。单单加字段的行为就很可怕。)
什么是NoSQL
NoSQL(Not only SQL,不仅仅是sql),泛指非关系型数据库,随着web2.0互联网的诞生,传统的关系型数据库很难满足现在的需求了,尤其是超大规模的高并发社区,暴露出来很多难以克服的问题,所以出现了NoSQL。
很多数据类型:比如用户的社交网络,地理位置,这些数据类型的存储都不需要一个固定的格式,不需要多余的操作就可以横向扩展的。比如java中的一个数据类型:Map<String,Object>。
NoSQL特点
- 方便扩展(数据之间没有关系,很好扩展。比如redis,你可以往里存任何你想存的信息,只要有唯一的key就行。而且你不管删除哪个也不会对别的有影响。)
- 大数据量高性能(redis一秒可以写8万次,一秒可以读11万次。)
- 数据类型是多样的(不需要事先设计数据库)。
所以现在真正实践起来,是关系型数据库+非关系型数据库一起使用的。
打个比方,一个互联网行业的电商的商品页:
Nosql的四大分类
1. KV键值对(例如redis,tair)
2. 文档型数据库(bson格式和json一样,但是是二进制的。典型的就是MongoDB)
- MongoDB是一个基于分布式文件存储的数据库(c++编写,主要用来处理大量的文件)。MongoDB是一个介于关系型数据库和非关系型数据的中间产品,是非关系型数据库中功能最丰富,最像关系型数据库的。