1、java采用unicode编码方式,即java字符串永远都是用unicode编码的。

2、JVM平台默认字符集:utf-8(可通过CharSet.defaultCharSet()来获取)

3、在处理从外部资源读入的数据时,需要注意编码问题,但我们常常的写法却是:

  1. InputStream is = new FileInputStream("res/input2.data");  
  2. InputStreamReader streamReader = new

在new InputStreamReader时未指定编码方式 ,这时采用的是JVM默认的编码集。当然,若我们知道外部资源的编码方式时,只需指定,以避免乱码的困扰,如:

  1. InputStreamReader streamReader = new InputStreamReader(is, "GB18030");  

4、unicode的编码:U+hhhh,每个h是一个16进制的数字;每个字符,其Unicode编码是确定的,但unicode的实现方式确依不同的系统有所不同,unicode的实现方式称为Unicode转换格式(Unicode Transformation Format,UTF)。常见的转换格式有:utf-8、utf-16、utf-32、GB18030等。


国标码:GBK, 国标码+繁体:GB2312,台湾地区对中文字符集的编码:BIG5

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6
标签: Java