c++编译时最常遇到的汉字

2024-06-16 22:48
文章标签 c++ 编译 遇到 汉字 最常

本文主要是介绍c++编译时最常遇到的汉字,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

首先,什么都不说,我们来看一段代码,然后试着编译运行:

[cpp] view plain copy print ?
  1. #include <iostream>  
  2.   
  3. #include <malloc.h>  
  4.   
  5. #include <string>  
  6. using namespace std;  
  7.   
  8. char* h = (char*)malloc(2*sizeof(char));  
  9. int main()  
  10. {  
  11.     string str;  
  12.     str.push_back(h[0]);  
  13.     str.push_back(h[1]);  
  14.     cout<<str<<endl;      
  15.     system("pause");  
  16.     return 0;  
  17. }  

运行结果截图:


问题一:为什么会出现“屯”?


下面,我们稍微改动一下,再来看看:

[cpp] view plain copy print ?
  1. #include <iostream>  
  2.   
  3. #include <malloc.h>  
  4.   
  5. #include <string>  
  6. using namespace std;  
  7.   
  8. int main()  
  9. {  
  10.     string str;  
  11.     char s[10];  
  12.     str.push_back(s[0]);  
  13.     str.push_back(s[1]);  
  14.     cout<<str<<endl;      
  15.     system("pause");  
  16.     return 0;  
  17. }  

运行结果截图:(注意:正常情况下编译时会出现以下情况,请点击continue)


生成结果:


问题二:

为什么会出现这个大家很熟悉的“烫”字?


在学习C++的时候,也许我们遇到的最多的两个汉字就是他们了(VC平台),有人可能会想,这是为什么?换句话说,对于上述二个问题,你有什么看法?下面请跟着我一步步的去探究这里面的原因:

首先对于问题一:

我们要清楚的一点是,这究竟是个例,还是普遍现象?我们再来验证一下:

[cpp] view plain copy print ?
  1. #include <iostream>  
  2.   
  3. #include <malloc.h>  
  4.   
  5. #include <string>  
  6. using namespace std;  
  7.   
  8. char* h1= (char*)malloc(2*sizeof(char));  
  9.   
  10. char* h2= (char*)malloc(2*sizeof(char));  
  11.   
  12. char* h3= (char*)malloc(10*sizeof(char));  
  13.   
  14. char* h4= new char[2];  
  15.   
  16. int main()  
  17. {  
  18.     string str;  
  19.       
  20.     str.push_back(h1[0]);  
  21.     str.push_back(h1[1]);  
  22.     cout<<"h1: "<<str<<endl;    
  23.     str.clear();  
  24.     str.push_back(h2[0]);  
  25.     str.push_back(h2[1]);  
  26.     cout<<"h2: "<<str<<endl;    
  27.     str.clear();  
  28.   
  29.     str.push_back(h3[0]);  
  30.     str.push_back(h3[1]);  
  31.     str.push_back(h3[2]);  
  32.     str.push_back(h3[3]);  
  33.     cout<<"h3: "<<str<<endl;    
  34.     str.clear();  
  35.   
  36.     str.push_back(h4[0]);  
  37.     str.push_back(h4[1]);  
  38.   
  39.     cout<<"h4: "<<str<<endl;    
  40.     system("pause");  
  41.     return 0;  
  42. }  

结果如下:



          看到结果之后,我们基本可以肯定,这并不是一个个例,而是普遍存在的现象(VC平台)。我们都清楚,在C++中,一般分成栈区域(Stack),堆区域(Heap),代码区(Code Area),数据区(Data Area)(又分为自由存储区,全局/静态存储区,常亮存储区).此处,我们仅仅考虑堆区域,和栈区域和自由存储区。堆区域一般存放的是动态内存,供程序随机申请使用,但是内存的申请与释放必须程序员亲力亲为,常见的比如New出来的内存块。栈区域则存放程序需要的局部数据,这些数据可以动态的反应程序中对函数的调用状态,一般来说系统自动回收。自由存储区是那些由malloc等分配的内存块,跟堆有点相似。这些是C++程序员应该掌握的一些基本内容。接着来,

          一个汉字占两个字节,经过以上验证,我们至少可以肯定的说,堆(还有自由存储区)未初始化时的内容是最多以两个字节(都是汉字"屯"嘛,当然也更可能是以一个字节为单位,因为也可能存在GBK编码重复的嘛(真实情况就是这样啦!后面验证。。))为单位的信息(至于什么信息,后面再来验证)。

         为了弄清,这里的"屯"字究竟是什么,请转到我的其中一篇博文http://blog.csdn.net/liygcheng/article/details/11686117,然后在该页面按Ctrl + F, 查找"屯"字的GBK编码,是不是下面这个情况呢?


相信这个大家都能看得懂吧,显然,"屯"字的GBK编码为“CDCD",这是16进制,那么这不就是说,每个字符的GBK编码是CD么? 显然这是一个负数-51,于是我们就可以下结论了,堆空间(还有自由存储区)未初始化时的默认字符是-51。不过,至于为什么一定要是-51,这个估计就要问微软了。。

     至此,问题一基本上已经回答完毕,那么问题二是不是也很简单呢?

提示:在VC中,栈空间未初始化时的字符默认是-52,补码是0xCC.

这篇关于c++编译时最常遇到的汉字的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1067773

相关文章

C++ vector越界问题的完整解决方案

《C++vector越界问题的完整解决方案》在C++开发中,std::vector作为最常用的动态数组容器,其便捷性与性能优势使其成为处理可变长度数据的首选,然而,数组越界访问始终是威胁程序稳定性的... 目录引言一、vector越界的底层原理与危害1.1 越界访问的本质原因1.2 越界访问的实际危害二、基

c++日志库log4cplus快速入门小结

《c++日志库log4cplus快速入门小结》文章浏览阅读1.1w次,点赞9次,收藏44次。本文介绍Log4cplus,一种适用于C++的线程安全日志记录API,提供灵活的日志管理和配置控制。文章涵盖... 目录简介日志等级配置文件使用关于初始化使用示例总结参考资料简介log4j 用于Java,log4c

C++归并排序代码实现示例代码

《C++归并排序代码实现示例代码》归并排序将待排序数组分成两个子数组,分别对这两个子数组进行排序,然后将排序好的子数组合并,得到排序后的数组,:本文主要介绍C++归并排序代码实现的相关资料,需要的... 目录1 算法核心思想2 代码实现3 算法时间复杂度1 算法核心思想归并排序是一种高效的排序方式,需要用

C++11范围for初始化列表auto decltype详解

《C++11范围for初始化列表autodecltype详解》C++11引入auto类型推导、decltype类型推断、统一列表初始化、范围for循环及智能指针,提升代码简洁性、类型安全与资源管理效... 目录C++11新特性1. 自动类型推导auto1.1 基本语法2. decltype3. 列表初始化3

C++11右值引用与Lambda表达式的使用

《C++11右值引用与Lambda表达式的使用》C++11引入右值引用,实现移动语义提升性能,支持资源转移与完美转发;同时引入Lambda表达式,简化匿名函数定义,通过捕获列表和参数列表灵活处理变量... 目录C++11新特性右值引用和移动语义左值 / 右值常见的左值和右值移动语义移动构造函数移动复制运算符

C++中detach的作用、使用场景及注意事项

《C++中detach的作用、使用场景及注意事项》关于C++中的detach,它主要涉及多线程编程中的线程管理,理解detach的作用、使用场景以及注意事项,对于写出高效、安全的多线程程序至关重要,下... 目录一、什么是join()?它的作用是什么?类比一下:二、join()的作用总结三、join()怎么

Go语言编译环境设置教程

《Go语言编译环境设置教程》Go语言支持高并发(goroutine)、自动垃圾回收,编译为跨平台二进制文件,云原生兼容且社区活跃,开发便捷,内置测试与vet工具辅助检测错误,依赖模块化管理,提升开发效... 目录Go语言优势下载 Go  配置编译环境配置 GOPROXYIDE 设置(VS Code)一些基本

C++中全局变量和局部变量的区别

《C++中全局变量和局部变量的区别》本文主要介绍了C++中全局变量和局部变量的区别,全局变量和局部变量在作用域和生命周期上有显著的区别,下面就来介绍一下,感兴趣的可以了解一下... 目录一、全局变量定义生命周期存储位置代码示例输出二、局部变量定义生命周期存储位置代码示例输出三、全局变量和局部变量的区别作用域

C++中assign函数的使用

《C++中assign函数的使用》在C++标准模板库中,std::list等容器都提供了assign成员函数,它比操作符更灵活,支持多种初始化方式,下面就来介绍一下assign的用法,具有一定的参考价... 目录​1.assign的基本功能​​语法​2. 具体用法示例​​​(1) 填充n个相同值​​(2)

java使用protobuf-maven-plugin的插件编译proto文件详解

《java使用protobuf-maven-plugin的插件编译proto文件详解》:本文主要介绍java使用protobuf-maven-plugin的插件编译proto文件,具有很好的参考价... 目录protobuf文件作为数据传输和存储的协议主要介绍在Java使用maven编译proto文件的插件