Authored by FengRuwei

hystrix学习分享

  1 +# Hystrix入门
  2 +yoho-core分布式服务的调用是通过spring的RestTemplete以http请求进行访问,通常http访问具有很多不确定因素,除了服务异常、常常还有网络或者业务引起的超时等问题(网络连接慢、资源繁忙、暂时不可用、服务脱机)。如果在web请求处理线程中直接进行http访问,在异常或者超时发生时,将会严重影响服务器的请求处理性能。当然我们可以自己封装服务调用,通过future等模式来实现服务的异步调用。yoho-core内使用Hystrix来间接的进行服务调用,服务调用过程是在hystrix管理的线程池中,因此使得服务调用过程与web线程能隔离开,保证服务器的稳定。
  3 +###
  4 +Hystrix把服务调用统称为依赖调用,在yoho-core中主要是http访问调用,当然也可以有其他形式的依赖,比如webservice、rpc甚至本地方法。
  5 +Hystrix通过命令模式封装依赖调用,每一个依赖调用封装在HystrixCommand中,每个命令在Hystrix的线程池中运行。另外可以对其配置分组名、线程组,使得不同的依赖可以分类在不同的线程组,隔离不同模块的依赖,也可根据负载情况,配置不同组的线程数。Hystrix还提供一种熔断器(CircuitBreaker)的机制,Hystrix可以通过设定的条件判断该封装的依赖调用是否可以正确调用,如果在一定时间内调用失败次数过多,则会熔断自身,使得相同的调用无法执行,待冷却之后重新再试。
  6 +
  7 +# 构造HystrixCommand
  8 +## 命名HystrixCommandKey
  9 +HystrixCommand有自己的名字,在yoho-core中即是远程服务名,比如order.cart,user.getVipInfo,product.get...等,Hystrix使用单例模式存储HystrixCommand,熔断机制正式基于单实例上的调用情况统计实现。如果不设置这个名字,Hystrix会为其设置默认的名字:类名。
  10 +## 分组HystrixCommandGroupKey
  11 +GroupKey是每个命令最少配置的必选参数,因为下一个参数HystrixThreadPoolKey如果不指定的话,其会使用该参数值
  12 +## 线程池 HystrixThreadPoolKey
  13 +ThreadPoolKey顾名思义,是HystrixCommand运行所在的线程池,如果该参数不设置则使用GroupKey作为ThreadPoolKey,这种情况下往往是同一个业务模块的依赖调用在同一个线程池内,yoho-core中使用服务模块[user,order,product等]作为GroupKey,各个模块。如果同一业务内的服务之间还需要隔离的话,就可以设置该参数,比如order的订单和购物车可以通过设置不同的ThreadPoolKey再区分到不同线程池中。
  14 +另外可以通过HystrixThreadPoolProperties设置线程池的属性,比如核心线程数大小、最大线程数、任务队列大小,和java的线程池一致,HystrixThreadPoolProperties本身也提供了一些默认值。
  15 +
  16 +##### 下面是简单的一个HystrixCommand的构造过程
  17 +## run()方法
  18 +实现run方法,执行具体的依赖调用。
  19 +## getFallback()方法
  20 +如果run方法中发生异常,或者run方法运行时间过长(相当于超时),又或者线程池中任务队列已满,这时HystrixCommand会调用getFallback返回一个默认值,当然也可以在这进行特殊的出错处理,该函数是运行在web请求线程中。如果没有重写该方法,那run抛出的异常将被抛到web请求线程中。
  21 +如果某个依赖的run方法在短时间内发生异常或超时次数过多,此时Hystrix会发生熔断,该依赖新的HystrixCommand执行会直接调用getFallback返回,避免无效的调用浪费资源。当然在冷却一段时间后,新的依赖调用还是会通过run重试。
  22 +```java
  23 + //构造setter
  24 + HystrixCommandGroupKey groupKey = HystrixCommandGroupKey.Factory.asKey(group);
  25 + HystrixThreadPoolKey threadPoolKey = HystrixThreadPoolKey.Factory.asKey(group);
  26 + HystrixCommandKey commandKey = HystrixCommandKey.Factory.asKey(service);
  27 + HytrixBaseCommand.Setter setter = HytrixBaseCommand.Setter.withGroupKey(groupKey)
  28 + .andCommandKey(commandKey)
  29 + .andThreadPoolKey(threadPoolKey);
  30 + //构造command
  31 + HystrixCommand<String> command = new HystrixCommand<String>(setter) {
  32 + protected String run() throws Exception {
  33 + logger.info("##################### in hystrix thread");
  34 + Thread.sleep(time);
  35 + if(isException)
  36 + throw new RuntimeException("exception in run");
  37 + return service+ ":return";
  38 + }
  39 + @Override
  40 + protected String getFallback() {
  41 + logger.info("##################### in request thread");
  42 + return service+":fallback";
  43 + }
  44 + };
  45 +```
  46 +
  47 +
  48 +### 执行HystrixCommand
  49 +HystrixCommand的执行有以下四种方式
  50 +### 1.execute()
  51 + 阻塞方式,内部使用queue().get()
  52 +### 2.queue()
  53 + 非阻塞方式,返回future对象,可以再调用get来阻塞调用获取结果
  54 +### 3.observe()
  55 +热注册方式
  56 +### 4.toObservable()
  57 +冷注册方式,等注册时执行
  58 +前三种调用方式,最终都是依赖第四种方式,yoho-core使用的是queue()
  59 +
  60 +
  61 +## 配置 Hystrix-dashboard
  62 +### 1.构建dashboard项目
  63 +```
  64 +$ git clone https://github.com/Netflix/Hystrix.git
  65 +$ cd Hystrix/hystrix-dashboard
  66 +$ ../gradlew jettyRun
  67 +```
  68 +打开路径:[http://localhost:7979/hystrix-dashboard](http://localhost:7979/hystrix-dashboard).
  69 +### 2.配置xml
  70 +```xml
  71 +<servlet>
  72 + <display-name>HystrixMetricsStreamServlet</display-name>
  73 + <servlet-name>HystrixMetricsStreamServlet</servlet-name>
  74 + <servlet-class>com.netflix.hystrix.contrib.metrics.eventstream.HystrixMetricsStreamServlet</servlet-class>
  75 +</servlet>
  76 + <servlet-mapping>
  77 + <servlet-name>HystrixMetricsStreamServlet</servlet-name>
  78 + <url-pattern>/hystrix.stream</url-pattern>
  79 +</servlet-mapping>
  80 +```
  81 +
  82 +### 3.添加stream
  83 +在hystrix-dashboard中按照说明添加自己的http://hystrix-app:port/hystrix.stream,然后监视
  84 +
  85 +### 4 如果是集群,通过turbine进行监视
  86 +//TODO
  87 +yoho目前只监控了gateway模块的服务调用,貌似只有在gateway的web.xml配置中配置了hystrix.stream来进行调用情况采集。
  88 +
  89 +### 流程图
  90 +简单的翻译下官网介绍,其中注意几点,excute,queue方法最终会调用toObservable方法。如果使用ObservableCommand,需要实现的方法分别为construct方法与resumeWithFallBack方法。
  91 +
  92 +![](PIC/hystrix_flow.png)
  93 +//TODO
  94 +1.
  95 +2.
  96 +3.
  97 +4.
  98 +5.
  99 +
  100 +### 测试例子
  101 +``` java
  102 +@Component
  103 +@RequestMapping("/cmd")
  104 +public class CmdCtl {
  105 + Logger logger = LoggerFactory.getLogger(CmdCtl.class);
  106 + @RequestMapping("/do")
  107 + @ResponseBody
  108 + public String getOne(@RequestParam String method,
  109 + @RequestParam(required = false,defaultValue = "0") Integer time,
  110 + @RequestParam(required = false,defaultValue = "false") Boolean isException) {
  111 + return dispatch(method,time,isException);
  112 + }
  113 +
  114 + public String dispatch(final String service,final int time,final boolean isException) {
  115 + String group = service.split("\\.")[0];
  116 + //构造setter
  117 + HystrixCommandGroupKey groupKey = HystrixCommandGroupKey.Factory.asKey(group);
  118 + HystrixThreadPoolKey threadPoolKey = HystrixThreadPoolKey.Factory.asKey(group);
  119 + HystrixCommandKey commandKey = HystrixCommandKey.Factory.asKey(service);
  120 + HytrixBaseCommand.Setter setter = HytrixBaseCommand.Setter.withGroupKey(groupKey) //分组名
  121 + .andCommandKey(commandKey) //依赖名
  122 + .andThreadPoolKey(threadPoolKey); //执行线程池名
  123 + //构造command
  124 + HystrixCommand<String> command = new HystrixCommand<String>(setter) {
  125 + protected String run() throws Exception {
  126 + logger.info("##################### in hystrix thread");
  127 + if(time>0)//模拟长时间操作
  128 + Thread.sleep(time);
  129 + if(isException) //模拟异常情况
  130 + throw new RuntimeException("exception in run");
  131 + return service+ ":return";
  132 + }
  133 + @Override
  134 + protected String getFallback() {
  135 + logger.info("##################### in request thread");
  136 + return service+":fallback";
  137 + }
  138 + };
  139 + //阻塞执行,获取结果
  140 + String rel=command.execute();
  141 + return rel;
  142 +
  143 + }
  144 +}
  145 +```
  146 +### 测试
  147 +可以通过设置不同的请求查看调用结果,对于熔断机制,因为默认的熔断器是在短时间内进行判断,因此可以通过jmeter进行并发测试。
  148 +![](PIC/hystrix_test.png)
  149 +启动30个线程执行
  150 +测试中有三类请求:
  151 +one.p1 time:1000 isException:false
  152 +one.p2 time:1000 isException:true
  153 +two.a1 time:100 isException:false
  154 +可以发现one.p1和one.p2 服务依赖出错情况较多,one.p2主要是由于抛出异常错误率为100%,且熔断器circult为open状态,one.p1因为运行时间较长,也发生了熔断,错误也较多。但是tow模块的请求未受到任何影响。
  155 +对于熔断机制,和一些参数设置还需要进一步学习研究。