Java java.lang.Character源码分析
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了Java java.lang.Character源码分析,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含967字,纯文字阅读大概需要2分钟。
内容图文
Unicode相关知识
Unicode,又称万国码、国际码、统一码、单一码。整理、编码了世界上大部分的文字系统。使得电脑可以用更为简单的方式来呈现和处理文字比如说常用的表情符号,Emoji :happy: , 已经被Unicode 标准化了。每个表情、字符都都分别对应了一组数字,称作代码值(code point,码点)。 以”U+” 开头 ,后面跟着一串十六进制的数字。
Java 对Unicode的支持
? Java使用了UTF-16 , Character 中使用两个字节表示一个char. 随着Unicode字符越来越多,两个字节是远远不够的。 Java 就用 两个char来表示,实际上在Character中用一个int来存储,占21bit。
就有了如下的定义, 表示了码点的范围。
public static final int MIN_CODE_POINT = 0x000000;
public static final int MAX_CODE_POINT = 0X10FFFF;
String s = "\uD83D\uDE05"; //
标签:lang,codePoint,java,int,char,源码,static,return,public
来源: https://blog.csdn.net/weixin_41692367/article/details/113619389