Java toLowerCase/toUpperCase方法导致长度不一致

例子:

String s = "İstanbullu";
System.out.println(s.length == s.toLowerCase().length)

İstanbullu是土耳其语伊斯坦布尔

原因:

官方文档 toLowerCase

使用给定语言环境的规则将此字符串中的所有字符转换为小写。大小写映射基于由字符类指定的Unicode标准版本。因为大小写映射并不总是1:1的字符映射,所以结果字符串的长度可能与原始字符串不同。

解决方案

方案一

自己写一个转换方法

public static String toLowerCase(String cs) {
        char[] letter = cs.toCharArray();
        for (int i = 0; i < cs.length(); i++) {
            char ch = letter[i];
            letter[i] = Character.toLowerCase(ch);
        }
        return new String(letter);
    }

方案二

s.toLowerCase(new Locale("tr","TR"));
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容