编写一个截取字符串的函数,输入为一个字符串和字节数,输出为按字节截取的字符串,但要保证汉字不被截取半个,如“我ABC”,4,应该截取“我AB”,输入“我ABC汉DEF”,6,应该输出“我ABC”,而不是“我ABC+汉的半个”。

首先要了解中文字符有多种编码及各种编码的特征。假设n为要截取的字节数。

public static void main(String[] args) throws Exception{
    String str ="我a爱中华abc我爱def';
    int num =trimGBK(str.getBytes("GBK"),6);
    System.out.println(str.substring(0,num));
 }
public static int trimGBK(byte[] buf,int n){
    int num = 0;
    boolean bChineseFirstHalf = false;
    for(int i=0;i<n;i++){
        if(buf[i]<0&& !bChineseFirstHalf){    //Byte的范围是-127-128,一个汉子占两个Byte且Byte[i]<0
          bChineseFirstHalf= true;  // 
        }else{
          num++;  //1    2   3 
          bChineseFirstHalf= false;
        }
    }
    return num;
}
image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容