24 碰到的一个 idea的奇怪的编码问题

2024-05-28 15:38
文章标签 问题 idea 碰到 编码 24 奇怪

本文主要是介绍24 碰到的一个 idea的奇怪的编码问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

以下为日记内容, 实质记录是发生在昨天, 08.09

咦, 现在的文档下载都至少需要 1个积分了吗, 之前的那些免费的文档似乎也被csdn控制成了需要1积分下载了 

--------------------------------------------------

今天 晚上 idea 遇到了一个编码问题 我不太明白, 说一下环境吧
idea 启动程序编码[-Dfile.encoding]默认是 utf-8, 然后 测试程序文件的编码 是gbk, 然后 System.out.println 出来[debug的结果也是一样]的结果为 该字符串的 gbk编码之后 utf-8解码的乱码 "���"
这个倒是正常的瑟, 文件写入以 gbk 写入, 然后 以utf-8读出 乱码, 然后 之后的时候, 我在测试程序配置了一下启动参数 -Dfile.encoding=gbk, 然后 妈的 返现输出 还是乱码 "???"
然后 之后的时候, 我就把 idea的 jvm 配置增加了 -Dfile.encoding=gbk, ## 这时候, 原来是 gbk 的文件, 不知为何idea突然 换成了以 utf-8 加载, 然后 我以gbk编码reload了一下, 正常了, 
然后 继续跑, 然后 发现, 还是 以gbk编码之后 utf-8解码的乱码 "���", 然后 之后 再启动测试程序配置了一下启动参数 -Dfile.encoding=gbk, 然后 还是 "???"


然后 就在我放弃的时候, 我删掉了 idea 的jvm配置 -Dfile.encoding, 然后 删掉了测试程序的 -Dfile.encoding, 然后 跑了一下, 我去 居然又好了, 真是奇怪
然后 我想了一下, 可能存在的原因, 可能是因为 我的项目是 gbk 编码嘛, 然后 但是存在部分文件是 utf-8 编码, 然后 在决策以什么编码编译的时候, 编译器可能以utf-8读取的文件, 但是 为什么测试程序 配置了 -Dfile.encoding=gbk, 然后 读取到的数据 仍然是乱码, 这个 我就不知道了[因为根本与 file.encoding的配置没有关系]
然后  我尝试证实一下这个猜想, 然后 更新了一下 外部的一个文件的编码, 以及 req_dto包下面的一个文件的编码, 更新为 utf-8, 然后 发现, 我的猜想是错的 !


java编译器编码和JVM编码问题?

https://www.zhihu.com/question/30977092/answer/50182545

然后 看了一下 R大的这篇文章, 我觉得问题可能实在 编译器编译的时候的编码, 可能在第一次进来的时候 和最后一次运行的时候, 可能是读取源码文件的时候编码可能不一致吧, 可能前者使用 utf-8读取的源码, 然后 后者以gbk读取的文件, 然后 执行的时候, 因为字节码规范约定的字符串以utf-8存储, 然后 jvm读取字节码的时候 以utf-8读取字符串[偏离了这里的问题之外]
问题的出现的原因
-----
这个 问题, 还得想想, 说不定 可以写出一篇博客, 如果能够重现问题就好了, 
哦, 说一下 问题的出现的吧, 首先是 我创建了一个 train_dto 的包, 然后 吧train相关的 reqdto 拷贝进来了, 文件格式是 utf-8m, 
然后 其余的大部分文件时 gbk, 外围的 test03 还有几个utf-8的文件, 然后 新建了一个 gbk 的 Test27GenerateXYJParamSql, 然后 跑的时候, 就出现了 这个问题,


源码的编码[gbk] - 编译器读取文件的编码
在之前存在乱码问题, 在之后增加 -Dfile.encoding idea配置选项, 然后又删除, 重启之后不存在乱码
源码的编码[utf-8] - 编译器读取文件的编码
吧 Test29OutputChinese 编码变成 utf-8, 然后 输出的结果 为 "浣犲ソ"[utf-8, gbk]
测试程序 源码 gbk, 加上-Dfile.encoding=gbk, 之后 str.getBytes("gbk"), "utf-8") 为 "???" [这个输出不一样, 可能是与System.out的输出编码有关系]
## 哦, 对了, 还有一个 编码是 System.out.println 编码, 但是 不应该是这个, 毕竟 debug 调试的时候, 字符串就已经是 乱码了,

哦, 对了 吧 Test29OutputChinese 编码变成 utf-8, 然后 javac -p 给定的字节码文件, 得到的结果 是"浣犲ソ"的乱码, 然后 文件如果是 gbk编码写出, 则是正常的 "你好", 因此, 可以推测出 javac 的读取源码的编码是 使用的编码是 gbk[也就是 R大回答的如果编译的时候 没有指定-encoding 读取平台默认编码, 我这里的默认编码为 gbk]

--------------------------------------------------
然后 加上 -Dfile.encoding=gbk, 字节码中得到的是正常的 "你好", 然后 str.getBytes("gbk") 得到的是 [-60,  -29,  -70,  -61]
加上 -Dfile.encoding=utf-8, 字节码中得到的是正常的 "你好", 然后 str.getBytes("gbk") 得到的是 [-60,  -29,  -70,  -61]
调试 上面的两个 -Dfile.encoding, 在 StringCoding. decode(byte[] ba, int off, int len) 末尾, 两个得到的结果是一致的 !
然后 看两个字符串包装的 char数组, 发现他们的数据 也是一样的, 然后 这里的输出不一样, 可能是与 System.out 的输出编码有关系[强调了三次]
在上面两个 -Dfile.encoding 调试的时候, 我去 jvm 还崩溃了一次, 在 StringCoding. decode(byte[] ba, int off, int len) 之后
然而 直接 run as 却没事,,. 我去 这是什么情况, 现在 不知为何, 只要 已在 String.class 中打断点, 一下就崩溃了[前几次调试都还行, 后来不知怎么的就挂了],, 不论哪一种 -Dfile.encoding

#
# A fatal error has been detected by the Java Runtime Environment:
#
#  EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000512142b9, pid=51568, tid=51764
#
# JRE version: Java(TM) SE Runtime Environment (7.0_40-b43) (build 1.7.0_40-b43)
# Java VM: Java HotSpot(TM) 64-Bit Server VM (24.0-b56 mixed mode windows-amd64 compressed oops)
# Problematic frame:
# V  [jvm.dll+0x542b9]
#
# Failed to write core dump. Minidumps are not enabled by default on client versions of Windows
#
# An error report file with more information is saved as:
# D:\Program Files\WorkStations\EclipseWorkStation\HelloWorld03\hs_err_pid51568.log
#
# If you would like to submit a bug report, please visit:
#   http://bugreport.sun.com/bugreport/crash.jsp
#

调试 StringEncoding.encode 的过程中的crsh 日志文件 : http://download.csdn.net/download/u011039332/9928429

今天 又来debug, 结果 还是 crash了, 然后 这里的日志是今天的crash日志, 昨天的被删掉了

 

--------------------------------------------------

对了, 差点忘记了放测试代码, 几句 System.out.println

 

/*** Test28OutputChinese** @author Jerry.X.He <970655147@qq.com>* @version 1.0* @date 8/9/2017 8:43 PM*/
public class Test28OutputChinese {// Test28OutputChinesepublic static void main(String[] args) throws Exception {String str = "你好";System.out.println(str);System.out.println(Charset.defaultCharset());byte[] gbkDecoded = str.getBytes("gbk");for (byte b : gbkDecoded) {System.out.print(b + " ");}System.out.println();String gbkUtf8 = new String(str.getBytes("gbk"), "utf-8");System.out.println(gbkUtf8);
//        info(new String(str.getBytes("gbk"), "ascii"));String utf8Gbk = new String(str.getBytes("utf-8"), "gbk");System.out.println(utf8Gbk);}}

--------------------------------------------------
 

 

 

希望之后能够回过头来真真正正的有头有尾的解释这个问题吧[上面都只是猜测], 哦, 对了 还有这个 crash 的原因

 

refer 

https://www.zhihu.com/question/30977092/answer/50182545

 

这篇关于24 碰到的一个 idea的奇怪的编码问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/1010980

相关文章

电脑蓝牙连不上怎么办? 5 招教你轻松修复Mac蓝牙连接问题的技巧

《电脑蓝牙连不上怎么办?5招教你轻松修复Mac蓝牙连接问题的技巧》蓝牙连接问题是一些Mac用户经常遇到的常见问题之一,在本文章中,我们将提供一些有用的提示和技巧,帮助您解决可能出现的蓝牙连接问... 蓝牙作为一种流行的无线技术,已经成为我们连接各种设备的重要工具。在 MAC 上,你可以根据自己的需求,轻松地

Java 中的跨域问题解决方法

《Java中的跨域问题解决方法》跨域问题本质上是浏览器的一种安全机制,与Java本身无关,但Java后端开发者需要理解其来源以便正确解决,下面给大家介绍Java中的跨域问题解决方法,感兴趣的朋友一起... 目录1、Java 中跨域问题的来源1.1. 浏览器同源策略(Same-Origin Policy)1.

如何清理MySQL中的binlog问题

《如何清理MySQL中的binlog问题》:本文主要介绍清理MySQL中的binlog问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目http://www.chinasem.cn录清理mysql中的binlog1.查看binlog过期时间2. 修改binlog过期

如何解决yum无法安装epel-release的问题

《如何解决yum无法安装epel-release的问题》:本文主要介绍如何解决yum无法安装epel-release的问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不... 目录yum无法安装epel-release尝试了第一种方法第二种方法(我就是用这种方法解决的)总结yum

IDEA实现回退提交的git代码(四种常见场景)

《IDEA实现回退提交的git代码(四种常见场景)》:本文主要介绍IDEA实现回退提交的git代码(四种常见场景),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1.已提交commit,还未push到远端(Undo Commit)2.已提交commit并push到

IDEA下"File is read-only"可能原因分析及"找不到或无法加载主类"的问题

《IDEA下Fileisread-only可能原因分析及找不到或无法加载主类的问题》:本文主要介绍IDEA下Fileisread-only可能原因分析及找不到或无法加载主类的问题,具有很好的参... 目录1.File is read-only”可能原因2.“找不到或无法加载主类”问题的解决总结1.File

idea中project的显示问题及解决

《idea中project的显示问题及解决》:本文主要介绍idea中project的显示问题及解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录idea中project的显示问题清除配置重China编程新生成配置总结idea中project的显示问题新建空的pr

redis在spring boot中异常退出的问题解决方案

《redis在springboot中异常退出的问题解决方案》:本文主要介绍redis在springboot中异常退出的问题解决方案,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴... 目录问题:解决 问题根源️ 解决方案1. 异步处理 + 提前ACK(关键步骤)2. 调整Redis消费者组

Ubuntu上手动安装Go环境并解决“可执行文件格式错误”问题

《Ubuntu上手动安装Go环境并解决“可执行文件格式错误”问题》:本文主要介绍Ubuntu上手动安装Go环境并解决“可执行文件格式错误”问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未... 目录一、前言二、系统架构检测三、卸载旧版 Go四、下载并安装正确版本五、配置环境变量六、验证安装七、常见

解决Java异常报错:java.nio.channels.UnresolvedAddressException问题

《解决Java异常报错:java.nio.channels.UnresolvedAddressException问题》:本文主要介绍解决Java异常报错:java.nio.channels.Unr... 目录异常含义可能出现的场景1. 错误的 IP 地址格式2. DNS 解析失败3. 未初始化的地址对象解决