#未知编码的字符串.startsWith(#)为什么会是false UTF-8 BOM编码的坑

2024-05-08 17:58

本文主要是介绍#未知编码的字符串.startsWith(#)为什么会是false UTF-8 BOM编码的坑,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

"#未知编码的字符串".startsWith("#")为什么会是false?

我都这么命名标题了,那么问题很显然,编码不统一导致

 

发现这个问题的背景:

      我在获取别人的t配置信息(txt文件)时,如果遇到以“#”开头,则说明是注释信息。但是我在用.startsWith("#")去判断时,居然出现这样的情况:

      一开始以为是“#”需要转义,尝试转义却途劳;然后一想,会不会是编码问题呢?一看txt文件的编码UTF-8-BOM,而我工程默认UTF-8编码,原来坑在这里。

举个例子:

public static void testString() throws UnsupportedEncodingException{String str1 = new String("#函购同虹款式f".getBytes(),"UTF-8");String str2 = new String("#函购同虹款式f".getBytes(),"GBK");String str3 = new String("#函购同虹款式f".getBytes(),"ISO-8859-1");String str4 = new String("#函购同虹款式f".getBytes(),"UTF-16");String str5 = new String("#函购同虹款式f".getBytes(),"GB2312");String str6 = new String("#函购同虹款式f".getBytes(),"Unicode");System.out.println(str1+"--UTF-8: " + str1.startsWith("#"));System.out.println(str2+"--GBK: " + str2.startsWith("#"));System.out.println(str3+"--ISO-8859-1: " + str3.startsWith("#"));System.out.println(str4+"--UTF-16: " + str4.startsWith("#"));System.out.println(str5+"--GB2312: " + str5.startsWith("#"));System.out.println(str6+"--Unicode: " + str6.startsWith("#"));}

输出结果为:

结论:

      从输入流中读取的字符串,需要首先判断其编码是否和自己编译文件的编码格式相同,否则很容易出现乱码或是执行一些操作得不到你想要的效果。

        我写了一点判断字符串编码格式的代码(注意:仅适用于UTF-8的编译环境下,即Java文件使用UTF-8编码)。

        请看这篇文章>>>>

这篇关于#未知编码的字符串.startsWith(#)为什么会是false UTF-8 BOM编码的坑的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/971026

相关文章

Springboot3+将ID转为JSON字符串的详细配置方案

《Springboot3+将ID转为JSON字符串的详细配置方案》:本文主要介绍纯后端实现Long/BigIntegerID转为JSON字符串的详细配置方案,s基于SpringBoot3+和Spr... 目录1. 添加依赖2. 全局 Jackson 配置3. 精准控制(可选)4. OpenAPI (Spri

使用Python实现base64字符串与图片互转的详细步骤

《使用Python实现base64字符串与图片互转的详细步骤》要将一个Base64编码的字符串转换为图片文件并保存下来,可以使用Python的base64模块来实现,这一过程包括解码Base64字符串... 目录1. 图片编码为 Base64 字符串2. Base64 字符串解码为图片文件3. 示例使用注意

golang float和科学计数法转字符串的实现方式

《golangfloat和科学计数法转字符串的实现方式》:本文主要介绍golangfloat和科学计数法转字符串的实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望... 目录golang float和科学计数法转字符串需要对float转字符串做处理总结golang float

Python如何判断字符串中是否包含特殊字符并替换

《Python如何判断字符串中是否包含特殊字符并替换》这篇文章主要为大家详细介绍了如何使用Python实现判断字符串中是否包含特殊字符并使用空字符串替换掉,文中的示例代码讲解详细,感兴趣的小伙伴可以了... 目录python判断字符串中是否包含特殊字符方法一:使用正则表达式方法二:手动检查特定字符Pytho

MySQL 字符串截取函数及用法详解

《MySQL字符串截取函数及用法详解》在MySQL中,字符串截取是常见的操作,主要用于从字符串中提取特定部分,MySQL提供了多种函数来实现这一功能,包括LEFT()、RIGHT()、SUBST... 目录mysql 字符串截取函数详解RIGHT(str, length):从右侧截取指定长度的字符SUBST

Python将字符串转换为小写字母的几种常用方法

《Python将字符串转换为小写字母的几种常用方法》:本文主要介绍Python中将字符串大写字母转小写的四种方法:lower()方法简洁高效,手动ASCII转换灵活可控,str.translate... 目录一、使用内置方法 lower()(最简单)二、手动遍历 + ASCII 码转换三、使用 str.tr

Java如何用乘号来重复字符串的功能

《Java如何用乘号来重复字符串的功能》:本文主要介绍Java使用乘号来重复字符串的功能,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Java乘号来重复字符串的功能1、利用循环2、使用StringBuilder3、采用 Java 11 引入的String.rep

基于Go语言实现Base62编码的三种方式以及对比分析

《基于Go语言实现Base62编码的三种方式以及对比分析》Base62编码是一种在字符编码中使用62个字符的编码方式,在计算机科学中,,Go语言是一种静态类型、编译型语言,它由Google开发并开源,... 目录一、标准库现状与解决方案1. 标准库对比表2. 解决方案完整实现代码(含边界处理)二、关键实现细

Java实现按字节长度截取字符串

《Java实现按字节长度截取字符串》在Java中,由于字符串可能包含多字节字符,直接按字节长度截取可能会导致乱码或截取不准确的问题,下面我们就来看看几种按字节长度截取字符串的方法吧... 目录方法一:使用String的getBytes方法方法二:指定字符编码处理方法三:更精确的字符编码处理使用示例注意事项方

解决IDEA报错:编码GBK的不可映射字符问题

《解决IDEA报错:编码GBK的不可映射字符问题》:本文主要介绍解决IDEA报错:编码GBK的不可映射字符问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录IDEA报错:编码GBK的不可映射字符终端软件问题描述原因分析解决方案方法1:将命令改为方法2:右下jav