1. 怎么实现高可用的架构:
- 通信模型
NIO - 多活模式
- 减少组件依赖 (核心接口不强依赖非核心接口,需要有相应预案策略,比如降级或者熔断)
降低由于引入第三方依赖服务导致的服务不可用问题 - 去中心化
减少复杂性?选举过程会导致STW? - 容灾机制
主备、数据备份
2. 定时/延时任务
- 延迟任务实现:
https://www.cnblogs.com/haoxinyue/p/6663720.html - Jesque 基础入门
https://blog.csdn.net/xiaojia1100/article/details/48004337 - jesque代码库
https://github.com/gresrun/jesque - 聊聊jesque的WorkerImpl与WorkerPool
https://www.jianshu.com/p/52a9fc801c16
3. vim命令总结:
- gg跳到第一行
- shift+g跳到最后一行
- /xxx 匹配某一字符串
4. linux命令
- find 文件名(支持模糊匹配) |xargs grep -ri 指定字符 -l :查找指定字符在文件中是否有出现,并且只返回满足条件的文件的文件名
- awk '{print 2..}',用于文本分析,默认空格、制表符为分隔符,1输出第一个被分隔的字符串,以此类推$2...
5. arthas命令
每隔10s监控调用情况(请求数等信息):
monitor -c 10 demo.MathGame primeFactors
打印调用堆栈信息:
trace demo.MathGame primeFactors
观察方法入参和返回值:
watch demo.MathGame primeFactors {params,returnObj}
观察方法入参和返回值并且指定第一个参数的值:
watch com.demo.service.DemoService getUser "{params,returnObj}" "params[0].equals('demo')" -x 2
** java.的类不能被arthas代理,这个时候可以参考如下进行解决:*
https://github.com/alibaba/arthas/issues/47
7. TCP三次握手和四次挥手?
- 为什么三次握手:保证延迟的消息会被正确的回收
- 为什么四次挥手:TCP连接的关闭是双方都需要确认的,另外一方面TIME_WAIT的作用:保证连接的正确关闭,等待2MSL,如果在这个时间内,被动关闭方没有收到ACK报文的话,会重新发送FIN报文
8. 什么是单元化,单元化的作用
每个单元可以独立的负责用户的请求,能够向其它单元同步数据的单元叫做中心
- 作用:异地多活,提高稳定性,保证RPC的响应效率
- 对该单元进行切流+禁写(保证数据的一致性,因为中心还没有把数据同步过来) - 可以类比redis主从异步复制的场景
步骤可以分为:禁写(禁止更新)、切流、同步、执行(恢复写)
9. 分布式事务
XA:两阶段提交之XA,prepare commit/rollback
TCC:try-precomit-commit
FMT:在XA和TCC之间找到平衡点(性能和耦合性),通过记录日志,类似于undolog(但是如果数据被改了要如何恢复-依赖框架的事务,需要锁定被修改的行,但是如果这行是热点数据的话,会导致性能的下降)
XA存在的问题:事务协调器的单点故障、从第一阶段就锁定资源(数据库链接,锁等资源)影响性能
TCC存在的问题:需要自己实现大量的回滚代码、在第一阶段锁定资源后就释放资源了
10. mysql索引
- 大字段如何建立索引?
使用前缀索引,可以通过
select count(distinct 索引字段) / count() from 表名; 查询索引的区分度,返回的值越大说明区分度越高
select count(distinct left(索引字段, 取多少个字段)) / count() from 表名;
当两者值大致相近时,说明区分度已经接近了
为什么使用前缀索引?解决索引占用空间的问题
会有什么问题?不可以使用覆盖索引了 - 对于身份证号码这类字段,前缀区分度不高,如何建立索引呢?
1)可以存储倒序字段,建立倒序字段的前缀索引
2)通过建立hash字段,但是为了精确匹配,在where条件还得加上hash前字段的等值比较
11. mysql优化
- limit如何优化
假设有如下表:
create table a (int id, int fr_id, varchar field, pk id, key fr_id)
先来看下面一句sql
select * from table_a order by fr_id limit 10000,100
上面这一段sql存在的问题:
虽让fr_id有索引,查询时可以用到fr_id索引,但是由于查询了所有字段会导致回表,并且随机读严重,扫面更多的页,最终会使整体sql的执行性能不佳
如何优化呢?
使用延迟关联:第一步先利用覆盖索引查询id,再做关联查询
select * from table a inner join (select id from table_a order by fr_id limit 10000,100) as b on a.id = b.id
如何进一步优化?
根据业务场景,如果不需要支持跳页(即只支持翻页,解决深度分页问题),可以考虑用如下进行优化
第一次查询
select * from fr_id > 0 order by fr_id limt 100
第二次查询
假设第一次查询的结果的最大fr_id为200,那么第二次查询的如下
select * from fr_id > 200 order by fr_id limt 100
使用翻页要考虑的问题时,字段一定要是单调自增的,不然在翻页的过程中会有漏数据
所以整体优化思路为:
1、使用延迟关联,解决两个问题(1.使用覆盖索引 2.避免随机读,提高性能)
2、根据业务场景,是否需要支持跳页查询?
12. jdk工具
jps:查看进程
jstack pid:查看进程堆栈
jstat -gc pid 3000[ms]:查看进程gc情况,每3s一次
jmap -heap pid:查看进行的堆和堆占用情况
jmap -histo pid | head -n 10:查看排行前10占用最多的对象
13. 网络
三次握手:(不是二次握手的原因:防止已经失效的连接请求报文生效)
最后一次握手,避免如果是只有两次握手时由于第一次握手由于网络延迟的问题,导致后续服务端占用了无效连接资源
四次挥手:
在主动关闭方收到第三次挥手时发送ack后会进入time_wait:维持2msl,即报文的最大持续时间
1)解决第三次挥手报文丢失(不是真正丢失的意思,比方说滞留时间过长),服务端可以进行重发
2)如果没有time_wait的话,此时如果允许创建连接,可能会出现新创建的连接收到之前丢失的报文,导致后续程序处理出现异常
14. 线程池
池化管理的思想,提供的好处:
- 降低资源消耗
创建和销毁带来的开销,可以做到线程复用 - 提高响应速度
请求到达时,无需耗费创建线程带来的开销 - 线程管理
统一管理,避免线程泛滥 - 提供高级功能
延迟任务、定时任务
15. 关于异常处理
16. 关于日志的正确使用
17. 数据迁移经验
18. mvn:deploy
该命令用于将maven项目打包,并上传自本地和远程的maven仓库
release和snapshot的区别:
使用snapshot,假如远程仓库发生变化了,依赖了snapshot的项目会从远程仓库加载依赖
使用release,假如某个版本号的依赖在远程仓库发生变化了,依赖了该版本号的maven项目会优先从本地仓库加载依赖
19.G1回收器
CMS的缺点:内存碎片、对大堆回收不友好(需要扫描整个堆)、浮动垃圾
何时使用G1:
- 堆内存大、多核CPU
- 期望停顿时间可预测,避免停顿时间无法预估导致的服务雪崩
- 不期望有太多的内存碎片
20、守护线程
守护线程的作用是为普通、非守护线程提供服务的,比如GC线程。假如虚拟机运行过程中,没有非守护线程在执行了,那么虚拟机可以退出
使用守护线程,必须注意:
1、setDaemon(true)必须在调用start方法之前,否则会抛出异常
2、不要在守护线程中做业务逻辑操作,因为无法预测非守护线程执行完毕之后,守护线程是否已经执行完毕该做的任务
3、守护线程中创建的线程也属于守护线程
21、线程和线程池的状态
https://blog.csdn.net/qq_24384579/article/details/93199116
22、git rebase 和 git merge
git rebase称作变基,会以rebase的分支为基准,将当前分支提交的记录提交到rebase的分支的最后提交记录之后
git rebase :带来的影响:会篡改修改记录、无法确认当前分支是从哪个节点checkout出来的
git merge:历史提交记录都在,每次merge会生成一条新的提交记录
23、idea中查看类、方法、属性的调用链/引用链
https://blog.csdn.net/qq_37126357/article/details/101055230
24、性能优化
如何找到可优化点:压测、arthas
日志、json.toJsonString, json.ParseObject、批量查询、预热(热点代码JIT即使编译)
25、stream流优化
https://blog.csdn.net/weixin_29088655/article/details/114935548
几个概念:水平执行、垂直执行
26、内存管理
Linux中Swap与Memory内存区别
https://blog.csdn.net/xili2532/article/details/122875250