首先要了解中文字符有多种编码及各种编码的特征。假设n为要截取的字节数。
public static void main(String[] args) throws Exception{
String str ="我a爱中华abc我爱def';
int num =trimGBK(str.getBytes("GBK"),6);
System.out.println(str.substring(0,num));
}
public static int trimGBK(byte[] buf,int n){
int num = 0;
boolean bChineseFirstHalf = false;
for(int i=0;i<n;i++){
if(buf[i]<0&& !bChineseFirstHalf){ //Byte的范围是-127-128,一个汉子占两个Byte且Byte[i]<0
bChineseFirstHalf= true; //
}else{
num++; //1 2 3
bChineseFirstHalf= false;
}
}
return num;
}