Hystrix是什么
在讲Hystrix之前,应该先了解一下Netflix这家神奇的公司。
想必很多人都看过美剧《纸牌屋》,不过应该很少有人知道它的出品方就是Netflix,可以说是《纸牌屋》之父,同时爱奇艺、优酷也是模仿Netflix的国内本土产品。作为一家在线影片租赁提供商,Netflix成立于1997年,在美国、加拿大提供互联网随选流媒体播放,定制DVD、蓝光光碟在线出租业务,经过多次商业模式的变革,Netflix成为了在线内容的霸主。据统计,Netflix在高峰期间的下载流量可以占到北美地区的1/3。
这里不得不提一点的是,从09年开始,Netflix逐渐把它的IT系统迁移到AWS云平台上,并开始业务的转型,从DVD租赁演变为在线视频供应商,依托于强大的AWS,这也给AWS带来了巨大挑战。
Netflix在AWS运行多年期间,总结了不少实践经验,比如必须考虑到故障的可能性,在AWS云平台上进行架构设计的一个经验法则是要作为一个悲观主义者来设计应用架构:假设会出问题。
我们知道硬件总会发生故障,服务器会发生宕机,唯一不确定的就是在什么时候发生,所以在应用架构上要进行高可用设计,比如需要有一个清晰的数据备份和恢复机制,并自动化这个流程。
一个用户看美剧看的好好的,后端提供该美剧的服务挂了,这时比较友好的方式是推送一部热门的电影给用户,这个动作即所谓的发生故障时的降级方案。
为此,Netflix API团队在2011年启动了弹性工程工作,即Hystrix,旨在通过控制那些访问远程系统、服务和第三方库的节点,从而对延迟和故障提供更强大的容错能力,提供了熔断、隔离、Fallback、cache、监控等功能,能够在一个、或多个依赖同时出现问题时保证系统依然可用,目前它在Netflix每天处理着数百亿的隔离线程以及数千亿的隔离信号调用。
Hystrix是基于Apache License 2.0协议的开源的程序库,目前托管在GitHub上。这个Star也是多的吓人,足够说明Hystrix的重要性。
什么场景可以使用
既然有了这么好的开源库,必须得好好利用,那么具体都用在什么场景呢?下面以一个门票产品为例,大概描述一下使用场景。
在一个门票详情的页面中,可能最终依赖了很多个底层服务,比如推荐服务、评分服务、资源服务、优惠服务、广告服务等。仔细查看可以发现,如果广告、推荐、评分、优惠等服务挂了,其实并不会影响整个下单流程,所以可以针对这些服务调用赋予熔断降级的能力。
如果这些服务真的挂了,那么返回一个预设好的值即可,这样用户也几乎察觉不出有什么异常。
如何使用Hystrix
目前Hystrix最新版本是1.5.13,在项目的pom文件中加上依赖
<dependency>
<groupId>com.netflix.hystrix</groupId>
<artifactId>hystrix-core</artifactId>
<version>1.5.13</version>
</dependency>
Command方式
Hystrix提供了Command模式的接入方式,如果一个服务CommandHelloWorld
需要熔断降级的能力,那么只需要继承Hystrix的HystrixCommand
类,并重写run方法和getFallback方法。
public class CommandHelloWorld extends HystrixCommand<String> {
private final String name;
public CommandHelloWorld(String name) {
super(HystrixCommandGroupKey.Factory.asKey("ExampleGroup"));
this.name = name;
}
@Override
protected String run() {
// 省略业务逻辑
// 该方法可能会抛出异常
return "Hello " + name + "!";
}
@Override
protected String getFallback() {
return "Hello Failure " + name + "!";
}
}
这里需要注意的是,不能直接执行run方法,这样熔断降级功能无法生效。
HystrixCommand
内部提供了两个方法:execute、queue
1、execute()
执行HystrixCommand
内部的execute方法,可以实现run方法的同步执行
new CommandHelloWorld("hello").execute();
2、queue()
执行HystrixCommand
内部的queue方法,可以实现run方法的异步执行
Future future = new CommandHelloWorld().queue();
String s = future.get();
如果依赖多个下游接口 ,通过异步方式,可以同时执行,提高接口性能。
注解方式
如果觉得Command模式比较的繁琐,Hystrix也提供了注解方式,不过必须引入hystrix-javanica,通过aspect的方式实现。
<dependency>
<groupId>com.netflix.hystrix</groupId>
<artifactId>hystrix-javanica</artifactId>
<version>1.5.13</version>
</dependency>
并且在xml配置文件中加入
<aop:aspectj-autoproxy/>
<bean id="hystrixAspect" class="com.netflix.hystrix.contrib.javanica.aop.aspectj.HystrixCommandAspect"></bean>
下面是注解方式的Helloworld
@Component
public class HystrixHelloworld {
@HystrixCommand(fallbackMethod = "fallback")
public String run() {
// 省略业务逻辑
// 该方法可能会抛出异常
return "Hello world!";
}
public String fallback() {
return "fallback";
}
在需要进行熔断降级的方法上加@HystrixCommand注解,并指定fallbackMethod,这里需要注意的是,被指定的fallback方法,其返回和参数申明和主方法需要保持一致。
什么时候熔断
默认情况下,如果run方法在运行期间,10秒总请求数超过20个,且有50%以上的请求发生异常,Hystrix内部会自动发生熔断,并且执行getFallback方法。
什么时候恢复
默认情况下,如果发生了熔断,Hystrix内部每隔5s进行一次试探,即放过一个正常请求到后端服务,如果这个请求成功了,就算后端服务恢复了,Hystrix内部会自动关闭熔断。