字符当前类型判断(中文)

判断当前文本是否包含中文

issue:此方法只能判断部分CJK字符(CJK统一汉字)

public boolean isChineseWord(String str) {   
    Pattern p = Pattern.compile("[\u4e00-\u9fa5]");    
    Matcher m = p.matcher(str);    
    return m.matches();
}

issue:完美判断是否包含中文方法(根据Unicode编码完美的判断中文汉字和符号)

private static boolean isChinese(char c) {
     Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
      if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS || 
          ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS|| 
          ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A || 
          ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_B|| 
          ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION ||
          ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS||
          ub == Character.UnicodeBlock.GENERAL_PUNCTUATION) {
                return true;
      }
      return false;
}
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 字符集和编码简介 在编程中常常可以见到各种字符集和编码,包括ASCII,MBCS,Unicode等字符集。确切的说...
    兰山小亭阅读 8,791评论 0 13
  • 原文在这里:各种字符集和编码详解 在软件的编码和实现中,我们可能会碰到个 一个比较头疼的问题--编码,不同字符间的...
    舌尖上的大胖阅读 1,872评论 0 2
  • “好了。” 梁凌插上保密卡,于梳妆打理间,将自己的声音再次传达“黑莲花”队的四位猛将: “我知道你们想干什么,但是...
    Mod模君阅读 387评论 0 1
  • 眼高手低,太容易满足是最容易附着在人身上,很不幸,我中招了,也可以说自己活该吧。 前两周有点想跳槽,投了简历,也有...
    穿山甲_F_先生阅读 350评论 0 0
  • 飘香柴火鸡 今天天气略微有点凉,吃货四人组一呼百应,决定去吃芙蓉大道的柴火鸡。 像我们这种资格吃货,从单位楼下的米...
    熊宴阅读 991评论 0 3