Unicode只有一个字符集,中文、日文、韩文三种文字一齐占用了Unicode中0x3000到0x9FFF的部分。Unicode目前普遍采用的是UCS-2标准,它用两个字节来编码一个字符,比如汉字"经"的编码是0x7ECF。因为字符码一般用十六进制来表示,为了与十进制区分,十六进制以0x开头,0x7ECF转换成十进制即是32463,UCS-2用两个字节来编码字符,两个字节就是16位二进制,2的16次方等于65536,所以UCS-2最多能编码65536个字符。编码从0到127的字符与ASCII编码的字符一样,比如字母"a"的Unicode编码是0x0061,对应的十进制是97,而"a"的A