GBK和UTF8之间的转换 C语言

2024-05-24 04:18
文章标签 语言 转换 之间 gbk utf8

本文主要是介绍GBK和UTF8之间的转换 C语言,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

GBK和UTF8之间的转换可以使用MultiByteToWideChar和WideCharToMultiByte两个API,方法是先把它们转换为中间编码Unicode,再转换为对应的编码即可。



#include  < stdio.h >
#include 
< windows.h >

// GBK编码转换到UTF8编码
int  GBKToUTF8(unsigned  char   *  lpGBKStr,unsigned  char   *  lpUTF8Str, int  nUTF8StrLen)
{
    wchar_t 
*  lpUnicodeStr  =  NULL;
    
int  nRetLen  =   0 ;

    
if ( ! lpGBKStr)   // 如果GBK字符串为NULL则出错退出
         return   0 ;

    nRetLen 
=  ::MultiByteToWideChar(CP_ACP, 0 ,( char   * )lpGBKStr, - 1 ,NULL,NULL);   // 获取转换到Unicode编码后所需要的字符空间长度
    lpUnicodeStr  =   new  WCHAR[nRetLen  +   1 ];   // 为Unicode字符串空间
    nRetLen  =  ::MultiByteToWideChar(CP_ACP, 0 ,( char   * )lpGBKStr, - 1 ,lpUnicodeStr,nRetLen);   // 转换到Unicode编码
     if ( ! nRetLen)   // 转换失败则出错退出
         return   0 ;

    nRetLen 
=  ::WideCharToMultiByte(CP_UTF8, 0 ,lpUnicodeStr, - 1 ,NULL, 0 ,NULL,NULL);   // 获取转换到UTF8编码后所需要的字符空间长度
    
    
if ( ! lpUTF8Str)   // 输出缓冲区为空则返回转换后需要的空间大小
    {
        
if (lpUnicodeStr)
            delete []lpUnicodeStr;
        
return  nRetLen;
    }
    
    
if (nUTF8StrLen  <  nRetLen)   // 如果输出缓冲区长度不够则退出
    {
        
if (lpUnicodeStr)
            delete []lpUnicodeStr;
        
return   0 ;
    }

    nRetLen 
=  ::WideCharToMultiByte(CP_UTF8, 0 ,lpUnicodeStr, - 1 ,( char   * )lpUTF8Str,nUTF8StrLen,NULL,NULL);   // 转换到UTF8编码
    
    
if (lpUnicodeStr)
        delete []lpUnicodeStr;
    
    
return  nRetLen;
}

//  UTF8编码转换到GBK编码
int  UTF8ToGBK(unsigned  char   *  lpUTF8Str,unsigned  char   *  lpGBKStr, int  nGBKStrLen)
{
    wchar_t * lpUnicodeStr 
=  NULL;
    
int  nRetLen  =   0 ;

    
if ( ! lpUTF8Str)   // 如果UTF8字符串为NULL则出错退出
         return   0 ;

    nRetLen 
=  ::MultiByteToWideChar(CP_UTF8, 0 ,( char   * )lpUTF8Str, - 1 ,NULL,NULL);   // 获取转换到Unicode编码后所需要的字符空间长度
    lpUnicodeStr  =   new  WCHAR[nRetLen  +   1 ];   // 为Unicode字符串空间
    nRetLen  =  ::MultiByteToWideChar(CP_UTF8, 0 ,( char   * )lpUTF8Str, - 1 ,lpUnicodeStr,nRetLen);   // 转换到Unicode编码
     if ( ! nRetLen)   // 转换失败则出错退出
         return   0 ;

    nRetLen 
=  ::WideCharToMultiByte(CP_ACP, 0 ,lpUnicodeStr, - 1 ,NULL,NULL,NULL,NULL);   // 获取转换到GBK编码后所需要的字符空间长度
    
    
if ( ! lpGBKStr)   // 输出缓冲区为空则返回转换后需要的空间大小
    {
        
if (lpUnicodeStr)
            delete []lpUnicodeStr;
        
return  nRetLen;
    }
    
    
if (nGBKStrLen  <  nRetLen)   // 如果输出缓冲区长度不够则退出
    {
        
if (lpUnicodeStr)
            delete []lpUnicodeStr;
        
return   0 ;
    }

    nRetLen 
=  ::WideCharToMultiByte(CP_ACP, 0 ,lpUnicodeStr, - 1 ,( char   * )lpGBKStr,nRetLen,NULL,NULL);   // 转换到GBK编码
    
    
if (lpUnicodeStr)
        delete []lpUnicodeStr;
    
    
return  nRetLen;
}

// 使用这两个函数的例子
int  main()
{
    
char  cGBKStr[]  =   " 我是中国人! " ;
    
char   *  lpGBKStr  =  NULL;
    
char   *  lpUTF8Str  =  NULL;
    FILE 
*  fp  =  NULL;
    
int  nRetLen  =   0 ;

    nRetLen 
=  GBKToUTF8((unsigned  char   * )cGBKStr,NULL,NULL);
    printf(
" 转换后的字符串需要的空间长度为:%d  " ,nRetLen);
    lpUTF8Str 
=   new   char [nRetLen  +   1 ];
    nRetLen 
=  GBKToUTF8((unsigned  char   * )cGBKStr,(unsigned  char   * )lpUTF8Str,nRetLen);
    
if (nRetLen)
    {
        printf(
" GBKToUTF8转换成功! " );
    }
    
else
    {
        printf(
" GBKToUTF8转换失败! " );
        
goto  Ret0;
    }
    
    fp 
=  fopen( " C:\GBK转UTF8.txt " , " wb " );   // 保存到文本文件
    fwrite(lpUTF8Str,nRetLen, 1 ,fp);
    fclose(fp);
    
    getchar();  
// 先去打开那个文本文件看看,单击记事本的“文件”-“另存为”菜单,在对话框中看到编码框变为了“UTF-8”说明转换成功了

    nRetLen 
=  UTF8ToGBK((unsigned  char   * )lpUTF8Str,NULL,NULL);   // 再转回来
    printf( " 转换后的字符串需要的空间长度为:%d  " ,nRetLen);
    lpGBKStr 
=   new   char [nRetLen  +   1 ];
    nRetLen 
=  UTF8ToGBK((unsigned  char   * )lpUTF8Str,(unsigned  char   * )lpGBKStr,nRetLen);
    
if (nRetLen)
    {
        printf(
" UTF8ToGBK转换成功!  " );
    }
    
else
    {
        printf(
" UTF8ToGBK转换失败!  " );
        
goto  Ret0;
    }

    fp 
=  fopen( " C:\UTF8转GBK.txt " , " wb " );   // 保存到文本文件
    fwrite(lpGBKStr,nRetLen, 1 ,fp);
    fclose(fp);
    
    getchar();  
// 再去打开文本文件看看,发现编码框又变为了“ANSI”说明转换成功了

Ret0:
    
if (lpGBKStr)
        delete []lpGBKStr;
    
    
if (lpUTF8Str)
        delete []lpUTF8Str;
        
    
return   0 ;
}

 在网上看到的一些文章说,UTF8转换为GBK的时候会有问题,特别是当UTF8字符串中的汉字数为奇数时。关于这个问题我没有去验证过,而且我对UTF8和GB2312的编码还不是很熟悉,呵呵,等以后有空的时候再去了解一下编码吧。

这篇关于GBK和UTF8之间的转换 C语言的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/997343

相关文章

使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解

《使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解》本文详细介绍了如何使用Python通过ncmdump工具批量将.ncm音频转换为.mp3的步骤,包括安装、配置ffmpeg环... 目录1. 前言2. 安装 ncmdump3. 实现 .ncm 转 .mp34. 执行过程5. 执行结

Java实现将HTML文件与字符串转换为图片

《Java实现将HTML文件与字符串转换为图片》在Java开发中,我们经常会遇到将HTML内容转换为图片的需求,本文小编就来和大家详细讲讲如何使用FreeSpire.DocforJava库来实现这一功... 目录前言核心实现:html 转图片完整代码场景 1:转换本地 HTML 文件为图片场景 2:转换 H

Python中Json和其他类型相互转换的实现示例

《Python中Json和其他类型相互转换的实现示例》本文介绍了在Python中使用json模块实现json数据与dict、object之间的高效转换,包括loads(),load(),dumps()... 项目中经常会用到json格式转为object对象、dict字典格式等。在此做个记录,方便后续用到该方

GO语言短变量声明的实现示例

《GO语言短变量声明的实现示例》在Go语言中,短变量声明是一种简洁的变量声明方式,使用:=运算符,可以自动推断变量类型,下面就来具体介绍一下如何使用,感兴趣的可以了解一下... 目录基本语法功能特点与var的区别适用场景注意事项基本语法variableName := value功能特点1、自动类型推

GO语言中函数命名返回值的使用

《GO语言中函数命名返回值的使用》在Go语言中,函数可以为其返回值指定名称,这被称为命名返回值或命名返回参数,这种特性可以使代码更清晰,特别是在返回多个值时,感兴趣的可以了解一下... 目录基本语法函数命名返回特点代码示例命名特点基本语法func functionName(parameters) (nam

使用Java读取本地文件并转换为MultipartFile对象的方法

《使用Java读取本地文件并转换为MultipartFile对象的方法》在许多JavaWeb应用中,我们经常会遇到将本地文件上传至服务器或其他系统的需求,在这种场景下,MultipartFile对象非... 目录1. 基本需求2. 自定义 MultipartFile 类3. 实现代码4. 代码解析5. 自定

Go语言连接MySQL数据库执行基本的增删改查

《Go语言连接MySQL数据库执行基本的增删改查》在后端开发中,MySQL是最常用的关系型数据库之一,本文主要为大家详细介绍了如何使用Go连接MySQL数据库并执行基本的增删改查吧... 目录Go语言连接mysql数据库准备工作安装 MySQL 驱动代码实现运行结果注意事项Go语言执行基本的增删改查准备工作

Go语言使用Gin处理路由参数和查询参数

《Go语言使用Gin处理路由参数和查询参数》在WebAPI开发中,处理路由参数(PathParameter)和查询参数(QueryParameter)是非常常见的需求,下面我们就来看看Go语言... 目录一、路由参数 vs 查询参数二、Gin 获取路由参数和查询参数三、示例代码四、运行与测试1. 测试编程路

Go语言使用net/http构建一个RESTful API的示例代码

《Go语言使用net/http构建一个RESTfulAPI的示例代码》Go的标准库net/http提供了构建Web服务所需的强大功能,虽然众多第三方框架(如Gin、Echo)已经封装了很多功能,但... 目录引言一、什么是 RESTful API?二、实战目标:用户信息管理 API三、代码实现1. 用户数据

Go语言网络故障诊断与调试技巧

《Go语言网络故障诊断与调试技巧》在分布式系统和微服务架构的浪潮中,网络编程成为系统性能和可靠性的核心支柱,从高并发的API服务到实时通信应用,网络的稳定性直接影响用户体验,本文面向熟悉Go基本语法和... 目录1. 引言2. Go 语言网络编程的优势与特色2.1 简洁高效的标准库2.2 强大的并发模型2.