keycloak接入飞书时中文乱码解决及思考

附飞书provider地址:https://github.com/tedgxt/keycloak-service-social-lark

场景介绍

在keycloak 8.0.1版本中添加飞书的identity provider,实现基于飞书的第三方免登陆授权。

问题现象

在调用飞书接口获取用户信息时,http response打印出来的名字信息(中文)是乱码。

确定问题边界

步骤一

由于keycloak的框架中,封装了一个SimpleHttp对象,用于http调用。因此得先判断下http client是否该存在问题。

首先通过Postman去调用相同接口,得到response的数据如下。可以看到在postman里显示的中文名字是正常显示的,且response的header中,Content-Type的值为application/json; charset=utf-8

{
    "code": 0,
    "data": {
        "email": "xiatao.guan@longbridge.sg",
        "en_name": "希夏(管峡涛)",
        "expires_in": 6900,
        "mobile": "+8615968878843",
        "name": "希夏(管峡涛)",
        "open_id": "ou_a2eba3085ce4b126891bcca48fe23eb3",
        "refresh_expires_in": 2591700,
        "refresh_token": "ur-D99OWLBARc3ZlD1Js0yqSg",
        "tenant_key": "2c81b678d5cf975e",
        "token_type": "Bearer",
        "union_id": "on_b2455e0574333e08a0ecea8b932deac9",
        "user_id": "fg7fe7f5"
    },
    "msg": "success"
}

步骤二

更进一步,在idea中新开一个java测试工程,导入keycloak相关的maven依赖包,通过keycloak的SimpleHttp client进行接口调用,发现也可以打印出正常的中文。

  String profileStr = SimpleHttp.doGet(PROFILE_URL, httpClient).auth(accessToken).asString();
  logger.info(profileStr);

步骤三

在keycloak代码中,添加测试代码logger.info("中文")以及System.Out.Println("中文"),查看日志中打印出来的中文也是乱码。

定位结果

综合以上定位过程可以发现,在keycloak的中文字符都不能正常显示。基本可以判断乱码问题与飞书的http调用无关,造成异常的原因应该在运行环境上

通过对比keycloak和测试工程的环境发现,keycloak本身是运行在jboss中的,而测试工程里代码是跑在idea启动的JVM上。下一步就是要解决jboss的编码问题。

通过Google发现,要解决JVM中的中文编码问题,可以通过配置参数-Dfile.encoding=XXX在启动JVM的时候来指定编码格式,从而不受操作系统和语言环境的影响。file.encoding 会影响未指定编码的字符串、读写文件、URL编码、打印等内容。

在jdk源码中搜索file.encoding,发现被defaultCharset()方法使用了,打开对应文件Charset.java

    /**
     * Returns the default charset of this Java virtual machine.
     *
     * <p> The default charset is determined during virtual-machine startup and
     * typically depends upon the locale and charset of the underlying
     * operating system.
     *
     * @return  A charset object for the default charset
     *
     * @since 1.5
     */
    public static Charset defaultCharset() {
        if (defaultCharset == null) {
            synchronized (Charset.class) {
                String csn = AccessController.doPrivileged(
                    new GetPropertyAction("file.encoding"));
                Charset cs = lookup(csn);
                if (cs != null)
                    defaultCharset = cs;
                else
                    defaultCharset = forName("UTF-8");
            }
        }
        return defaultCharset;
    }

这段注释说明了defaultCharset返回的是JVM的默认编码格式。且该编码格式是在jvm启动时便确定了,且依赖于jvm所在的操作系统的区域以及字符集。从代码中可以看出,defaultCharset()的值就是从 file.encoding这个属性中获取的。

于是在keycloak代码中加入如下代码段,打印出当前的编码配置:

// fix 中文字符问题
Properties initProp = new Properties(System.getProperties());
logger.info("current file.encoding:" + initProp.getProperty("file.encoding"));
logger.info("current Charset.defaultCharset :" + Charset.defaultCharset());

根据打印结果显示,file.encodingCharset.defaultCharset打印的值都是ASCII,并非期望的UTF-8,这就解释了为何打印中文在日志中显示的都是乱码。

解决过程

知道了要改的内容,接下来解决的过程就比较简单了。通过Google搜索到,jboss是使用standalone.xml作为其启动配置文件。在路径/opt/jboss/keycloak/standalone/configuration中找到了该文件。按照网上的方法,在standalone.xml添加了相关编码配置,然而打开日志一看并没有作用。

于是逐步分析keycloak的启动过程,通过对keycloak的dockerfile层层抽丝剥茧,发现entrypoint调用了standalone.sh,在standalone.sh中又调用了standalone.conf

bash-4.4$ cat standalone.sh|grep standalone
# Usage : standalone.sh --debug
#         standalone.sh --debug 9797
    RUN_CONF="$DIRNAME/standalone.conf"
...
...
...
# Read an optional running configuration file
if [ "x$RUN_CONF" = "x" ]; then
    RUN_CONF="$DIRNAME/standalone.conf"
fi

再一次Google一下jboss的相关资料,发现jboss是使用standalone.xml作为默认配置,而把standalone.conf作为配置首选项(Linux环境中是standalone.conf,Windows环境是standalone.bat)。这也就说明了为什么修改了standalone.xml后,并没有起作用,还需要检查standalone.conf的配置。

The standalone startup script i.e. *standalone.sh* for OSX/Linux and *standalone.bat* for Windows, utilizes:

- *standalone.conf/standalone.conf.bat*: defines the JVM preferences for the standalone server instance
- *standalone.xml*: defines the default configurations for the server; we can find it under *$JBOSS_HOME/standalone/configuration*.

因此在standalone.conf中添加上配置JAVA_OPTS="$JAVA_OPTS -Dfile.encoding=UTF-8",重新构建keycloak镜像并启动容器。

在未添加JVM的编码格式时,keycloak的启动日志中JAVA_OPTS如下:

=========================================================================

 JBoss Bootstrap Environment

 JBOSS_HOME: /opt/jboss/keycloak

 JAVA: java


 JAVA_OPTS:  -server -Xms64m -Xmx512m -XX:MetaspaceSize=96M -XX:MaxMetaspaceSize=256m -Djava.net.preferIPv4Stack=true -Djboss.modules.system.pkgs=org.jboss.byteman -Djava.awt.headless=true  --add-exports=java.base/sun.nio.ch=ALL-UNNAMED --add-exports=jdk.unsupported/sun.misc=ALL-UNNAMED --add-exports=jdk.unsupported/sun.reflect=ALL-UNNAMED

=========================================================================

指定了file.encoding=UTF-8后,keycloak的启动日志中可以看到JAVA_OPTS中编码格式为UTF-8

=========================================================================

 JBoss Bootstrap Environment

 JBOSS_HOME: /opt/jboss/keycloak

 JAVA: java

 JAVA_OPTS:  -server -Xms64m -Xmx512m -XX:MetaspaceSize=96M -XX:MaxMetaspaceSize=256m -Djava.net.preferIPv4Stack=true -Djboss.modules.system.pkgs=org.jboss.byteman -Djava.awt.headless=true -Dfile.encoding=UTF-8  --add-exports=java.base/sun.nio.ch=ALL-UNNAMED --add-exports=jdk.unsupported/sun.misc=ALL-UNNAMED --add-exports=jdk.unsupported/sun.reflect=ALL-UNNAMED

=========================================================================

打开日志,发现已经可以打印出中文,大功告成。

总结思考

对keycloak、jboss以及jvm基本上算是小白,看到编码问题更是慌了手脚,最终花了一整天的时间才彻底解决这个问题。回想起来,解决该问题的根本因素就是jvm的编码配置。

总结一下几点事后经验:

  1. 碰到未知问题,首先确定问题边界,缩小问题定位范围。如用postman调用飞书接口排除飞书server端问题;用logger打印中文字符排除http调用的问题。

  2. 要敢于了解系统原理,最好直接去阅读相关源码(时间充足的情况)。本项目最初预期只是写点java代码去开发一个keycloak的provider用于对接飞书,开发、解决问题的过程中却额外涉及了编码、jboss、jvm等新知识,人总是喜欢蹲在熟悉的环境中,为了解决问题只好硬着头皮上了。

  3. 构建知识领域地图,不断补全相关知识漏洞。如果对jvm、jboss一开始就很熟悉,想必解决问题的时间可以减半;知识掌握的越多,后续遇到新问题的解决过程就会越顺利。

  4. Google大法好!

参考资料

  1. 深入分析 Java 中的中文编码问题

  2. Java| Charset.defaultCharset()和file.encoding的关系

  3. JBoss Server – How to Start and Stop?

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,444评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,421评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,363评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,460评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,502评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,511评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,280评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,736评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,014评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,190评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,848评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,531评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,159评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,411评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,067评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,078评论 2 352

推荐阅读更多精彩内容