go gbk和utf8g互转(mahonia)和判断对应编码方法

2024-02-24 22:20

本文主要是介绍go gbk和utf8g互转(mahonia)和判断对应编码方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、导入库  github.com/axgle/mahonia

二、使用方式 

 

str :="我是中国人"
coderGbkToUtf8 := mahonia.NewDecoder("GBK") // GBK转成utf8编码
coderGbkToUtf8.ConvertString(str)coderUtf8ToGbk := mahonia.NewEncoder("GBK") // utf8转成GBK编码
coderUtf8ToGbk.ConvertString(src)

 三、判断字符串类型

1、判断是不是gbk

// 是不是gbk
func isGBK(str string) bool {data := []byte(str)dataLen := len(data)var i int = 0for i < dataLen {if data[i] <= 0x7f {//编码0~127,只有一个字节的编码,兼容ASCII码i++continue} else {if i+1 >= dataLen {return false}//大于127的使用双字节编码,落在gbk编码范围内的字符if data[i] >= 0x81 &&data[i] <= 0xfe &&data[i+1] >= 0x40 &&data[i+1] <= 0xfe &&data[i+1] != 0xf7 {i += 2continue} else {return false}}}return true
}

2、判断是不是Utf8 (没使用go自带的utf8判断,测试有些字符串判断有问题,如“系统”,“时装”,可能只是本人有问题)

// 是否utf8
func isUtf8(str string) bool {i := 0data := []byte(str)dataLen := len(data)for i < dataLen {if (data[i] & 0x80) == 0x00 {// 0XXX_XXXXi++continue} else if num := preNUm(data[i]); num > 2 {// 110X_XXXX 10XX_XXXX// 1110_XXXX 10XX_XXXX 10XX_XXXX// 1111_0XXX 10XX_XXXX 10XX_XXXX 10XX_XXXX// 1111_10XX 10XX_XXXX 10XX_XXXX 10XX_XXXX 10XX_XXXX// 1111_110X 10XX_XXXX 10XX_XXXX 10XX_XXXX 10XX_XXXX 10XX_XXXX// preNUm() 返回首个字节的8个bits中首个0bit前面1bit的个数,该数量也是该字符所使用的字节数i++for j := 0; j < num-1; j++ {//判断后面的 num - 1 个字节是不是都是10开头if i >= dataLen {return false}if (data[i] & 0xc0) != 0x80 {return false}i++}} else {//其他情况说明不是utf-8return false}}return true
}
func preNUm(data byte) int {var mask byte = 0x80var num int = 0//8bit中首个0bit前有多少个1bitsfor i := 0; i < 8; i++ {if (data & mask) == mask {num++mask = mask >> 1} else {break}}return num
}

 

这篇关于go gbk和utf8g互转(mahonia)和判断对应编码方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/743553

相关文章

基于Go语言实现Base62编码的三种方式以及对比分析

《基于Go语言实现Base62编码的三种方式以及对比分析》Base62编码是一种在字符编码中使用62个字符的编码方式,在计算机科学中,,Go语言是一种静态类型、编译型语言,它由Google开发并开源,... 目录一、标准库现状与解决方案1. 标准库对比表2. 解决方案完整实现代码(含边界处理)二、关键实现细

浅析如何使用xstream实现javaBean与xml互转

《浅析如何使用xstream实现javaBean与xml互转》XStream是一个用于将Java对象与XML之间进行转换的库,它非常简单易用,下面将详细介绍如何使用XStream实现JavaBean与... 目录1. 引入依赖2. 定义 JavaBean3. JavaBean 转 XML4. XML 转 J

解决IDEA报错:编码GBK的不可映射字符问题

《解决IDEA报错:编码GBK的不可映射字符问题》:本文主要介绍解决IDEA报错:编码GBK的不可映射字符问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录IDEA报错:编码GBK的不可映射字符终端软件问题描述原因分析解决方案方法1:将命令改为方法2:右下jav

判断PyTorch是GPU版还是CPU版的方法小结

《判断PyTorch是GPU版还是CPU版的方法小结》PyTorch作为当前最流行的深度学习框架之一,支持在CPU和GPU(NVIDIACUDA)上运行,所以对于深度学习开发者来说,正确识别PyTor... 目录前言为什么需要区分GPU和CPU版本?性能差异硬件要求如何检查PyTorch版本?方法1:使用命

Go语言开发实现查询IP信息的MCP服务器

《Go语言开发实现查询IP信息的MCP服务器》随着MCP的快速普及和广泛应用,MCP服务器也层出不穷,本文将详细介绍如何在Go语言中使用go-mcp库来开发一个查询IP信息的MCP... 目录前言mcp-ip-geo 服务器目录结构说明查询 IP 信息功能实现工具实现工具管理查询单个 IP 信息工具的实现服

Python如何精准判断某个进程是否在运行

《Python如何精准判断某个进程是否在运行》这篇文章主要为大家详细介绍了Python如何精准判断某个进程是否在运行,本文为大家整理了3种方法并进行了对比,有需要的小伙伴可以跟随小编一起学习一下... 目录一、为什么需要判断进程是否存在二、方法1:用psutil库(推荐)三、方法2:用os.system调用

Python实现特殊字符判断并去掉非字母和数字的特殊字符

《Python实现特殊字符判断并去掉非字母和数字的特殊字符》在Python中,可以通过多种方法来判断字符串中是否包含非字母、数字的特殊字符,并将这些特殊字符去掉,本文为大家整理了一些常用的,希望对大家... 目录1. 使用正则表达式判断字符串中是否包含特殊字符去掉字符串中的特殊字符2. 使用 str.isa

Python中判断对象是否为空的方法

《Python中判断对象是否为空的方法》在Python开发中,判断对象是否为“空”是高频操作,但看似简单的需求却暗藏玄机,从None到空容器,从零值到自定义对象的“假值”状态,不同场景下的“空”需要精... 目录一、python中的“空”值体系二、精准判定方法对比三、常见误区解析四、进阶处理技巧五、性能优化

go 指针接收者和值接收者的区别小结

《go指针接收者和值接收者的区别小结》在Go语言中,值接收者和指针接收者是方法定义中的两种接收者类型,本文主要介绍了go指针接收者和值接收者的区别小结,文中通过示例代码介绍的非常详细,需要的朋友们下... 目录go 指针接收者和值接收者的区别易错点辨析go 指针接收者和值接收者的区别指针接收者和值接收者的

Go 语言中的select语句详解及工作原理

《Go语言中的select语句详解及工作原理》在Go语言中,select语句是用于处理多个通道(channel)操作的一种控制结构,它类似于switch语句,本文给大家介绍Go语言中的select语... 目录Go 语言中的 select 是做什么的基本功能语法工作原理示例示例 1:监听多个通道示例 2:带