JDK1.7-String源码详解

2024-04-11 18:58
文章标签 源码 详解 string jdk1.7

本文主要是介绍JDK1.7-String源码详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 

    String表示字符串,是char的有序集合,在java中所有的字符串值,都是String的实例。
    String类提供了很多方法,如获取字符串中的字符,比较字符串,查询字符等。
    Java给String的 + 操作提供了很好的支持,相加后会返回一个字符常量结果。

    String类是不可变(final)的,对String类的任何改变,都是返回一个新的String类对象。所以任何对String的修改操作 (如+) 都会重新创建一个String对象。如果想要动态地操作,可以自己来维护一个char数组,或者使用StringBuilder/StringBuffer。

    String是char的有序集合,体现在String内部就是char的数组,所以本质是在操作char。String内部维护着一个char数组,一切对String的操作都是对char数组的操作。因为String的不可变性,此处也要使用final来修饰。

private final char value[];  

 

    由上,String的构造函数就很容易理解了,可以传入一个char数组,或者传入一个String对象,然后把char数组值copy过去,更新size等值就可以了。
    这里的copy是有必要的,避免受到原引用的影响。

public String(char value[]) {int size = value.length;this.offset = 0;this.count = size;this.value = Arrays.copyOf(value, size);}
public String(String original) {int size = original.count;char[] originalValue = original.value;char[] v;if (originalValue.length > size) {    // 判断size范围int off = original.offset;v = Arrays.copyOfRange(originalValue, off, off + size);} else {v = originalValue;}this.offset = 0;this.count = size;this.value = v;}

 

Arrays.copyOf()最终会调用System.arraycopy(),后者是java的数组copy中最原始的方法,再底层就是本地方法了,所以只要是数组copy最好都用这个。
    在第二个构造函数,传String对象的时候,需要判断size和offset的关系,因为String的值不一定是整个char数组都是有效的,这里赋值只取有效部分。

 

offset


    在String中,使用offset属性来指定第一个有效的字符的位置,从这个开始到char数组的末尾都是有效地。从此处看出,String实际上是一个char数组中连续的字符串。 
    private final int offset;

 

    另外,使用count属性来保存有效char数组的长度,就是(value.size – offset)。很多地方校验String的长度,或者是否为空,都使用了这个属性。

    private final int count;public int length() {return count;}public boolean isEmpty() {return count == 0;}

     在一般情况下,offset都等于0,所以count = value.size。那么offset这个属性有什么意义呢?
    其实,offset可以用在String对象的复用上,有时候一些返回部分字串的方法,如substring()等,就可以通过修改offset属性,来获取源String的一部分,反正String对象是不可变的,所以不会交叉影响。
    不过在JDK的String上,还没有使用到这样的逻辑,涉及到修改String的都是重新创建一个新的对象,如下面的substring()。

    public String substring(int beginIndex, int endIndex) {if (beginIndex < 0) throw new StringIndexOutOfBoundsException(beginIndex);if (endIndex > count) throw new StringIndexOutOfBoundsException(endIndex);if (beginIndex > endIndex) throw new StringIndexOutOfBoundsException(endIndex - beginIndex);return ((beginIndex == 0) && (endIndex == count)) ? this : new String(offset + beginIndex, endIndex - beginIndex, value);}

    在截取String前,需要进行index范围的校验,如果超出范围会抛出异常。和js以及php等不用,这里不会自动去根据String的值来调整截取范围,这也是Java强类型的一个体现吧。


equals

    判断字符串是否相等,实际上是比较两个char数组:
1、判断是否同一个对象;
2、判断是否String对象;
3、循环其中的char数组,看元素和次序是否都相等。
    这里的相等是次序和元素的完全相等,和数组相等是同一个标准,可以参考Arrays.equals(),而和List的标准不一样,可以参考CollectionUtils.isEqualCollection()。
    同理,equalsIgnoreCase()也是同样的实现方式,只是比较字符的时候IgnoreCase。

public boolean equals(Object anObject) {if (this == anObject) {return true;}if (anObject instanceof String) {String anotherString = (String) anObject;int n = count;if (n == anotherString.count) {char v1[] = value;char v2[] = anotherString.value;int i = offset;int j = anotherString.offset;while (n-- != 0) {if (v1[i++] != v2[j++])return false;}return true;}}return false;}

    类似的,compareTo也是逐个比较字符的大小,这里顺序比较,只要找到不相等的元素,返回两者之差即可。这里比较的是两个字符的Unicode,所以两者的差为Unicode之差,如果相等,则返回0,大于返回>0,小于返回<0。
    这里的compareTo()是大小写敏感的,不敏感可以用compareToIgnoreCase(),实现原理大抵相同。

public int compareTo(String anotherString) {int len1 = count;int len2 = anotherString.count;int n = Math.min(len1, len2);    // 取最短的,此处只要找不等char v1[] = value;char v2[] = anotherString.value;int i = offset;int j = anotherString.offset;if (i == j) {int k = i;int lim = n + i;while (k < lim) {char c1 = v1[k];char c2 = v2[k];if (c1 != c2) {return c1 - c2;}k++;}} else {while (n-- != 0) {char c1 = v1[i++];char c2 = v2[j++];if (c1 != c2) {return c1 - c2;}}}return len1 - len2;}

 

indexof

    String中的indexof()是判断目标是否存在String中,并定位。
下面看看经典的定位字符串indexof(String str):
    在source[offset+fromIndex]到source[offset+count]中,寻找target [offset]至target [offset+count]的字串。
① 先找到first的位置(循环过滤不同)
② 然后再找到end的位置(循环过滤相同)
③ 判断end-first是否为target.len,相等即找到,返回first-offset;
否则循环①②③。

        static int indexOf(char[] source, int sourceOffset, int sourceCount,char[] target, int targetOffset, int targetCount, int fromIndex) {// 前面省略范围判断----------------------------------------char first = target[targetOffset];int max = sourceOffset + (sourceCount - targetCount);for (int i = sourceOffset + fromIndex; i <= max; i++) {/* Look for first character. */if (source[i] != first) while (++i <= max && source[i] != first){}/* Found first character, now look at the rest of v2 */if (i <= max) {int j = i + 1;int end = j + targetCount - 1;/* 循环,直到出现不同的字符 */for (int k = targetOffset + 1; j < end && source[j] == target[k]; j++, k++){}if (j == end) {return i - sourceOffset;    /* Found whole string. */}}}return -1;}

    校验String是否以prefix为开始,就是找出String前和prefix一样长度的字串,然后通过equals的逻辑来校验是否相等。

public boolean startsWith(String prefix) {return startsWith(prefix, 0);
}
public boolean startsWith(String prefix, int toffset) {char ta[] = value;int to = offset + toffset;char pa[] = prefix.value;int po = prefix.offset;int pc = prefix.count;// Note: toffset might be near -1>>>1.if ((toffset < 0) || (toffset > count - pc)) {return false;}while (--pc >= 0) {if (ta[to++] != pa[po++]) {return false;}}return true;
}
public boolean endsWith(String suffix) {return startsWith(suffix, count - suffix.count);
}

    另外,判断是否以suffix结尾,也是同样的一个逻辑,(count - suffix.count)截取和suffix一样长度的字串,然后判断equals。

 

replace

    replace()用于覆盖原来的字串,替换成新的。就是先找到源字符(串),然后再替换。
    这里先讨论字符替换的,比较简单,查找方便,替换的时候也不用重新创建char数组,因为长度不变。  而字符串的replace()是直接调用正则来匹配替换的,这里就不讨论了。

public String replace(char oldChar, char newChar) {if (oldChar != newChar) {int len = count;int i = -1;char[] val = value;       /* avoid getfield opcode */int off = offset;          /* avoid getfield opcode */while (++i < len)   if (val[off + i] == oldChar) break;if (i < len) {char buf[] = new char[len];for (int j = 0; j < i; j++) {buf[j] = val[off + j];}while (i < len) {char c = val[off + i];buf[i] = (c == oldChar) ? newChar : c;i++;}return new String(0, len, buf);}}return this;}

    如上,先找到oldChar的位置i,break掉,再把i前的字符放到新的数组中,把i处字符换成新的字符,最后再对i后的赋值。
    这里先找到oldChar再替换的方式,还可以用另外两种来处理: 1、全部的if相等就替换;2、先Arrays.copy()再替换。  
    而这里的优点在于:如果找不到oldChar,不用新建char[]和String
 

 

intern                        

    String私有地维护了一个初始时为空的字符串常量池。

    字符串常量是在编译期就加载到常量池了(相同的字符串指向同一个String对象),直接调用就可以了。而String.intern()可以自定义添加到字符串常量池中。

    具体可以参考我的《String字符常量池和intern()

 

    --文中的代码取自JDK1.7

这篇关于JDK1.7-String源码详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/894914

相关文章

基于C++的UDP网络通信系统设计与实现详解

《基于C++的UDP网络通信系统设计与实现详解》在网络编程领域,UDP作为一种无连接的传输层协议,以其高效、低延迟的特性在实时性要求高的应用场景中占据重要地位,下面我们就来看看如何从零开始构建一个完整... 目录前言一、UDP服务器UdpServer.hpp1.1 基本框架设计1.2 初始化函数Init详解

springboot+redis实现订单过期(超时取消)功能的方法详解

《springboot+redis实现订单过期(超时取消)功能的方法详解》在SpringBoot中使用Redis实现订单过期(超时取消)功能,有多种成熟方案,本文为大家整理了几个详细方法,文中的示例代... 目录一、Redis键过期回调方案(推荐)1. 配置Redis监听器2. 监听键过期事件3. Redi

Springboot配置文件相关语法及读取方式详解

《Springboot配置文件相关语法及读取方式详解》本文主要介绍了SpringBoot中的两种配置文件形式,即.properties文件和.yml/.yaml文件,详细讲解了这两种文件的语法和读取方... 目录配置文件的形式语法1、key-value形式2、数组形式读取方式1、通过@value注解2、通过

自定义注解SpringBoot防重复提交AOP方法详解

《自定义注解SpringBoot防重复提交AOP方法详解》该文章描述了一个防止重复提交的流程,通过HttpServletRequest对象获取请求信息,生成唯一标识,使用Redis分布式锁判断请求是否... 目录防重复提交流程引入依赖properties配置自定义注解切面Redis工具类controller

Python容器转换与共有函数举例详解

《Python容器转换与共有函数举例详解》Python容器是Python编程语言中非常基础且重要的概念,它们提供了数据的存储和组织方式,下面:本文主要介绍Python容器转换与共有函数的相关资料,... 目录python容器转换与共有函数详解一、容器类型概览二、容器类型转换1. 基本容器转换2. 高级转换示

HTML5的input标签的`type`属性值详解和代码示例

《HTML5的input标签的`type`属性值详解和代码示例》HTML5的`input`标签提供了多种`type`属性值,用于创建不同类型的输入控件,满足用户输入的多样化需求,从文本输入、密码输入、... 目录一、引言二、文本类输入类型2.1 text2.2 password2.3 textarea(严格

C++ move 的作用详解及陷阱最佳实践

《C++move的作用详解及陷阱最佳实践》文章详细介绍了C++中的`std::move`函数的作用,包括为什么需要它、它的本质、典型使用场景、以及一些常见陷阱和最佳实践,感兴趣的朋友跟随小编一起看... 目录C++ move 的作用详解一、一句话总结二、为什么需要 move?C++98/03 的痛点⚡C++

MySQL中between and的基本用法、范围查询示例详解

《MySQL中betweenand的基本用法、范围查询示例详解》BETWEENAND操作符在MySQL中用于选择在两个值之间的数据,包括边界值,它支持数值和日期类型,示例展示了如何使用BETWEEN... 目录一、between and语法二、使用示例2.1、betwphpeen and数值查询2.2、be

python中的flask_sqlalchemy的使用及示例详解

《python中的flask_sqlalchemy的使用及示例详解》文章主要介绍了在使用SQLAlchemy创建模型实例时,通过元类动态创建实例的方式,并说明了如何在实例化时执行__init__方法,... 目录@orm.reconstructorSQLAlchemy的回滚关联其他模型数据库基本操作将数据添

Java中ArrayList与顺序表示例详解

《Java中ArrayList与顺序表示例详解》顺序表是在计算机内存中以数组的形式保存的线性表,是指用一组地址连续的存储单元依次存储数据元素的线性结构,:本文主要介绍Java中ArrayList与... 目录前言一、Java集合框架核心接口与分类ArrayList二、顺序表数据结构中的顺序表三、常用代码手动