String 最多能存储多少个字符/String 字符串的最大长度/String 字符串有没有长度限制

本文主要是介绍String 最多能存储多少个字符/String 字符串的最大长度/String 字符串有没有长度限制,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 1.编译时字节限制
  • 2.运行时长度限制
  • 3.小结
  • 4.补充

基于 JDK8 进行分析

1.编译时字节限制

String s = "11111...1111"; // 其中有 10 万个字符 "1"

当我们使用如上形式定义一个字符串的时候,当我们执行 javac 编译时,是会抛出异常的,提示 java: constant string too long

javac 是用于将 Java 源文件编译成 class 字节码二进制文件,那么在 class 文件生成过程中,就需要遵守一定的规范。

根据《Java 虚拟机规范》中对常量池的定义,CONSTANT_String_info 用于表示 java.lang.String 类型的常量对象,格式如下:

 CONSTANT_String_info {u1 tag;u2 string_index;
}

其中,string_index 项的值必须是对常量池的有效索引,常量池在该索引处的项必须是 CONSTANT_Utf8_info 结构,表示一组 Unicode 码点序列,这组 Unicode 码点序列最终会被初始化为一个 String 对象。

CONSTANT_Utf8_info 结构用于表示字符串常量的值:

CONSTANT_Utf8_info {u1 tag;u2 length;u1 bytes[length];
}

其中,length 则指明了 bytes[] 数组的长度,其类型为 u2,即两个字节的无符号数,那么其可表示的最大值为 2 16 − 1 = 65535 2^{16} - 1 = 65535 2161=65535

也就是说,编译时生成的 class 文件中的字符串常量的字节数不能超过 65535。

但即使我们定义了一个由 65535 个 “1” 组成的字符串,还是会允许报错,报错原因还是 java: constant string too long

这个原因可以在 javactools.jar 包中找到,在 com.sun.tools.javac.jvm.Gen 类中有如下方法:

private void checkStringConstant(JCDiagnostic.DiagnosticPosition var1, Object var2) {// String.length() >= 65535 就抛出异常if (this.nerrs == 0 && var2 != null && var2 instanceof String && ((String)var2).length() >= 65535) {this.log.error(var1, "limit.string", new Object[0]);++this.nerrs;}
}

当参数类型为 String,并且长度大于等于 65535 的时候,就会导致编译失败。

为什么最大长度是 65534 而不是 65535 呢?这是 Java 虚拟机历史上的一个设计缺陷:如果 Java 虚拟机中的一个方法的 code 属性的长度刚好是 65535 个字节,并且以一个 1 个字节长度的指令结束,那么这条指令将不能被异常处理器所处理。不过编译器可以通过限制任何方法、实例初始化方法或类初始化方法的 code[] 数组最大长度为 65534,这样可以间接弥补这个 BUG。

所以,综合 CONSTANT_Utf8_info 中的 length 大小限制与 javac 检查机制,字符串常量的最大字节数为 65535,最大长度为 65534。

Java 中的字符常量都是使用 UTF8 编码的,UTF8 编码使用 1~4 个字节来表示具体的 Unicode 字符。所以有的字符占用一个字节,而我们平时所用的大部分中文都需要 3 个字节来存储。

// 65534 个字母,编译通过
String s1 = "dd..d";// 21845 个中文 “自”,编译通过
String s2 = "自自...自";// 一个英文字母 d 加上 21845 个中文 “自”,编译失败
String s3 = "d自自...自";
  • 对于 s1,一个字母 d 的 UTF8 编码占用 1 个字节,65534 字母占用 65534 个字节,长度是 65534,字节数与长度都没有超出限制,所以可以编译通过。
  • 对于 s2,一个中文占用 3 个字节,21845 个正好占用 65535 个字节,而且字符串长度是 21845,字节数与长度都没有超出限制,所以可以编译通过。
  • 对于 s3,一个英文字母 d 加上 21845 个中文“自”占用 65536 个字节,超过了最大字节数,编译失败。

2.运行时长度限制

public int length() {return value.length;
}

String 类提供了一个 length() 方法,返回值为有符号的 32 位的 int 类型,所以理论上 String 的最大长度为 2 31 − 1 2^{31} -1 2311,因此在最大长度情况下占用内存约 ( 2 31 − 1 ) ∗ 2 ∗ 16 / 8 / 1024 / 1024 / 1024 = 4 G B (2^{31}-1)*2*16/8/1024/1024/1024 = 4GB (2311)216/8/1024/1024/1024=4GB​。如果 JVM 不能分配这么多内存的话,会出现 OOM 内存不足错误。

// success
public class Main {public static void main(String[] args) throws IOException {String s = "";for (int i = 0; i < 100000; i++) {s += "1";}// 100000System.out.println(s.length());System.out.println(s);}
}

3.小结

String 在不同的时期,具有不同的长度限制。

  • 编译时限制:UTF8 编码的字符串常量的最大字节数为 65535,最大长度为 65534
  • 运行时限制:字符串的长度不能超过 2 31 − 1 2^{31}-1 2311,且占用的内存不能超过当前虚拟机还能够提供的最大值。

4.补充

JDK9 以后对 String 的存储进行了优化。底层不再使用 char 数组存储字符串,而是使用 byte 数组。对于 LATIN1 字符的字符串可以节省一倍的内存空间。

这篇关于String 最多能存储多少个字符/String 字符串的最大长度/String 字符串有没有长度限制的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/945706

相关文章

MySQL常用字符串函数示例和场景介绍

《MySQL常用字符串函数示例和场景介绍》MySQL提供了丰富的字符串函数帮助我们高效地对字符串进行处理、转换和分析,本文我将全面且深入地介绍MySQL常用的字符串函数,并结合具体示例和场景,帮你熟练... 目录一、字符串函数概述1.1 字符串函数的作用1.2 字符串函数分类二、字符串长度与统计函数2.1

C# $字符串插值的使用

《C#$字符串插值的使用》本文介绍了C#中的字符串插值功能,详细介绍了使用$符号的实现方式,文中通过示例代码介绍的非常详细,需要的朋友们下面随着小编来一起学习学习吧... 目录$ 字符使用方式创建内插字符串包含不同的数据类型控制内插表达式的格式控制内插表达式的对齐方式内插表达式中使用转义序列内插表达式中使用

Java获取当前时间String类型和Date类型方式

《Java获取当前时间String类型和Date类型方式》:本文主要介绍Java获取当前时间String类型和Date类型方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,... 目录Java获取当前时间String和Date类型String类型和Date类型输出结果总结Java获取

go动态限制并发数量的实现示例

《go动态限制并发数量的实现示例》本文主要介绍了Go并发控制方法,通过带缓冲通道和第三方库实现并发数量限制,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 目录带有缓冲大小的通道使用第三方库其他控制并发的方法因为go从语言层面支持并发,所以面试百分百会问到

详解MySQL中JSON数据类型用法及与传统JSON字符串对比

《详解MySQL中JSON数据类型用法及与传统JSON字符串对比》MySQL从5.7版本开始引入了JSON数据类型,专门用于存储JSON格式的数据,本文将为大家简单介绍一下MySQL中JSON数据类型... 目录前言基本用法jsON数据类型 vs 传统JSON字符串1. 存储方式2. 查询方式对比3. 索引

MySQL字符串常用函数详解

《MySQL字符串常用函数详解》本文给大家介绍MySQL字符串常用函数,本文结合实例代码给大家介绍的非常详细,对大家学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录mysql字符串常用函数一、获取二、大小写转换三、拼接四、截取五、比较、反转、替换六、去空白、填充MySQL字符串常用函数一、

SpringBoot3.X 整合 MinIO 存储原生方案

《SpringBoot3.X整合MinIO存储原生方案》本文详细介绍了SpringBoot3.X整合MinIO的原生方案,从环境搭建到核心功能实现,涵盖了文件上传、下载、删除等常用操作,并补充了... 目录SpringBoot3.X整合MinIO存储原生方案:从环境搭建到实战开发一、前言:为什么选择MinI

Python中反转字符串的常见方法小结

《Python中反转字符串的常见方法小结》在Python中,字符串对象没有内置的反转方法,然而,在实际开发中,我们经常会遇到需要反转字符串的场景,比如处理回文字符串、文本加密等,因此,掌握如何在Pyt... 目录python中反转字符串的方法技术背景实现步骤1. 使用切片2. 使用 reversed() 函

Python实现对阿里云OSS对象存储的操作详解

《Python实现对阿里云OSS对象存储的操作详解》这篇文章主要为大家详细介绍了Python实现对阿里云OSS对象存储的操作相关知识,包括连接,上传,下载,列举等功能,感兴趣的小伙伴可以了解下... 目录一、直接使用代码二、详细使用1. 环境准备2. 初始化配置3. bucket配置创建4. 文件上传到os

MySQL查询JSON数组字段包含特定字符串的方法

《MySQL查询JSON数组字段包含特定字符串的方法》在MySQL数据库中,当某个字段存储的是JSON数组,需要查询数组中包含特定字符串的记录时传统的LIKE语句无法直接使用,下面小编就为大家介绍两种... 目录问题背景解决方案对比1. 精确匹配方案(推荐)2. 模糊匹配方案参数化查询示例使用场景建议性能优