记一次Dubbo枚举参数的问题排查

问题描述:

服务A依赖服务B的dubbo接口yyyMethod,其中传参XxxRequest中有个枚举类型APP,有时服务A调用yyyMethod后的代码会出现异常(非必现)。

@Data
public class XxxRequest implements Serializable {
        private APP app;
    .....
}
@Data
@Builder
public class XxxResponse implements Serializable {

    private String code;

    private String msg;

    private Map<String, Object> ext;

    private Boolean result;
}
@Override
public XxxResponse yyyMethod(XxxRequest request) {
    if (request == null) {
        return XxxResponse.builder().build();
    }
    boolean result = ....;
    return XxxResponse.builder()
                        .code("8000")
              .result(result)
              .build();
}

ServiceA中的调用代码:

Transaction transaction = Cat.newTransaction("aaaa", "bbb");
try{
        XxxRequest request = new XxxRequest();
    request.setApp(APP.xxx);
    ....
        response = serviceB.yyyMethod(request);
    if(response != null && !response.getResult()){
        ......
    }
}catch (Exception e) {
    transaction.setStatus(e);
    log.warn("xxxxx fail! errorMsg:{}", e.getMessage());
} finally {
    transaction.complete();
}

2. 排查过程及猜想

因为ServiceA中的代码调用中的log.warn日志中没有带出异常e的堆栈,所以给问题排查带来一定难度。从日志中看:xxxxx fail! errorMsg:null。也无法确定异常的类型,然后去Cat碰运气上找对应transaction的exception类型,发现是一个java.lang.NullPointerException。

transaction.setStatus(e)会将异常的类型带上,代码如下:

 public void setStatus(Throwable e) {
    this.status = e.getClass().getName();
    this.statusCode = -1;
 }

由上步骤能确定异常类型为NullPointerException,但是因为没有堆栈,所以暂时怀疑是XxxResponse中的result的大Boolean是个null,所以才出现的NPE。

于是去yyyMethod方法中去查找result可能返回空的逻辑,也就只能定位到request==null时,才会返回result=null的XxxResponse了,但是ServiceA中的代码调用中request是不为null的,所以有点困惑。苦想无果,暂时搁置。

第二天注意到了XxxRequest中的枚举值,之前也看过Dubbo文档中说过的枚举值的最佳实践。但是也没说调用方传入服务端不识别的枚举值时,会出现什么后果。显示去检查ServiceA和ServiceB中的APP所在包的版本,发现不一致,ServiceA的版本领先于ServiceB,所以存在枚举值不一致的情况。于是开始写Demo去实验:调用方传入服务端不识别的枚举值时的标签。

Demo验证及Dubbo源码debug分析:

demo验证:

  1. 本地将ServiceB中的APP对应jar包版本指定为低版本,启动是增加参数:dubbo.provider.version=ZJX 防止测试环境流量访问。

  2. demo测试方法:

参数app传一个ServiceB没有:

public class ServiceBTest extends BaseDubboServiceTest<ServiceB> {

    @Test
    @AssignEnv(value = Env.TEST, version="ZJX")
    public void testYyyMethod() {
        XxxRequest request = new XxxRequest();
        request.setApp(APP.xxxx);
        ....
        System.out.println(getService().yyyMethod(request));
    }
}
  1. 测试结果:

yyyMethod中拿到的request是一个null, 结果返回了一个result为null的XxxResponse实例。

Dubbo源码debug分析:

以下为dubbo 2.7代码为例,直接跳到解析参数的地方:org.apache.dubbo.rpc.protocol.dubbo.DecodeableRpcInvocation.decode(Channel channel, InputStream input)

....
 args = new Object[pts.length];
 for (int i = 0; i < args.length; i++) {
        try {
                args[i] = in.readObject(pts[i]);
        } catch (Exception e) {
                if (log.isWarnEnabled()) {
                        log.warn("Decode argument failed: " + e.getMessage(), e);
                }
        }
 }
 ....

org.apache.dubbo.common.serialize.Serialization上默认使用的是hessian2,也就是说请求的时候,序列化使用的是hessian2,那么反序列化也是用的hessian2。对应:org.apache.dubbo.common.serialize.hessian2.Hessian2Serialization

package org.apache.dubbo.common.serialize;

@SPI("hessian2")
public interface Serialization {
.....
}

大致链路:Hessian2Serialization->Hessian2ObjectInput->Hessian2Input->SerializerFactory.getDeserializer(Class).readObject(AbstractHessianInput)

SerializerFactory中对自定义Class使用的是默认的反序列化类:JavaDeserializer

protected Deserializer getDefaultDeserializer(Class cl) {
        return new JavaDeserializer(cl);
}

JavaDeserializer中大致分两步:

  1. 实例化对象
    @Override
    public Object readObject(AbstractHessianInput in, String[] fieldNames)
            throws IOException {
        try {
            Object obj = instantiate();

            return readObject(in, obj, fieldNames);
        } catch (IOException e) {
            throw e;
        } catch (RuntimeException e) {
            throw e;
        } catch (Exception e) {
            throw new IOExceptionWrapper(_type.getName() + ":" + e.getMessage(), e);
        }
    }
  1. 反序列化属性值并注入对象
public Object readObject(AbstractHessianInput in,
                             Object obj,
                             String[] fieldNames)
            throws IOException {
        try {
            int ref = in.addRef(obj);

            for (int i = 0; i < fieldNames.length; i++) {
                String name = fieldNames[i];

                FieldDeserializer deser = (FieldDeserializer) _fieldMap.get(name);

                if (deser != null)
                    deser.deserialize(in, obj);
                else
                    in.readObject();
            }

            Object resolve = resolve(obj);

            if (obj != resolve)
                in.setRef(ref, resolve);

            return resolve;
        } catch (IOException e) {
            throw e;
        } catch (Exception e) {
            throw new IOExceptionWrapper(obj.getClass().getName() + ":" + e, e);
        }
    }

枚举类型对应的反序列化类是:com.alibaba.com.caucho.hessian.io.EnumDeserializer. 大致逻辑是找到对应枚举类,调用其valueOf(Class, String) 方法去获取对应的枚举值。

/**
 * Deserializing an enum valued object
 */
public class EnumDeserializer extends AbstractDeserializer {
    private Class _enumType;
    private Method _valueOf;

    public EnumDeserializer(Class cl) {
        // hessian/33b[34], hessian/3bb[78]
        if (cl.isEnum())
            _enumType = cl;
        else if (cl.getSuperclass().isEnum())
            _enumType = cl.getSuperclass();
        else
            throw new RuntimeException("Class " + cl.getName() + " is not an enum");

        try {
            _valueOf = _enumType.getMethod("valueOf",
                    new Class[]{Class.class, String.class});
        } catch (Exception e) {
            throw new RuntimeException(e);
        }
    }

    @Override
    public Class getType() {
        return _enumType;
    }

    @Override
    public Object readMap(AbstractHessianInput in)
            throws IOException {
        String name = null;

        while (!in.isEnd()) {
            String key = in.readString();

            if (key.equals("name"))
                name = in.readString();
            else
                in.readObject();
        }

        in.readMapEnd();

        Object obj = create(name);

        in.addRef(obj);

        return obj;
    }

    @Override
    public Object readObject(AbstractHessianInput in, String[] fieldNames)
            throws IOException {
        String name = null;

        for (int i = 0; i < fieldNames.length; i++) {
            if ("name".equals(fieldNames[i]))
                name = in.readString();
            else
                in.readObject();
        }

        Object obj = create(name);

        in.addRef(obj);

        return obj;
    }

    private Object create(String name)
            throws IOException {
        if (name == null)
            throw new IOException(_enumType.getName() + " expects name.");

        try {
            return _valueOf.invoke(null, _enumType, name);
        } catch (Exception e) {
            throw new IOExceptionWrapper(e);
        }
    }
}

Enum.valueOf逻辑:

 public static <T extends Enum<T>> T valueOf(Class<T> enumType,
                                                String name) {
        T result = enumType.enumConstantDirectory().get(name);
        if (result != null)
            return result;
        if (name == null)
            throw new NullPointerException("Name is null");
        throw new IllegalArgumentException(
            "No enum constant " + enumType.getCanonicalName() + "." + name);
    }

所以当枚举值是我当前枚举不存在的值时,valueOf方法会抛异常IllegalArgumentException。EnumDeserializer中会抛出IOExceptionWrapper, 一直往上抛到DecodeableRpcInvocation.decode中对于参数处理的部分(下图):可以看出参数反序列化失败的异常被catch住后忽略了,造成的结果就是整个XxxRequest参数值为null了。

....
 args = new Object[pts.length];
 for (int i = 0; i < args.length; i++) {
        try {
                args[i] = in.readObject(pts[i]);
        } catch (Exception e) {
                if (log.isWarnEnabled()) {
                        log.warn("Decode argument failed: " + e.getMessage(), e);
                }
        }
 }
 ....

结论:

  1. 异常堆栈在日志中一定要带出来,不然无法定位到异常发生的具体行,就有点无头苍蝇的感觉。
  2. 参数为null的处理逻辑,要么就按失败处理,返回指定错误码;要么就不处理,等报NPE,也方便及时发现问题。
  3. 枚举的使用最佳实践参考官方:最佳实践。其中第二点说明了对于可变的枚举值,不建议使用枚举。在不识别的枚举值反序列化时,会出现异常,当该参数直接是方法的参数时,那么服务端获取到的该参数值为null;当枚举是自定义类中的属性,那么服务端获取到的该自定义类参数的值将会是null.
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 221,198评论 6 514
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,334评论 3 398
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 167,643评论 0 360
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,495评论 1 296
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,502评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,156评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,743评论 3 421
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,659评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,200评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,282评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,424评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,107评论 5 349
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,789评论 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,264评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,390评论 1 271
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,798评论 3 376
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,435评论 2 359