mysql/Java服务端对emoji(utf8mb4编码)的支持有关的问题

2024-02-18 10:18

本文主要是介绍mysql/Java服务端对emoji(utf8mb4编码)的支持有关的问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

mysql/Java服务端对emoji(utf8mb4编码)的支持有关的问题


mysql中保存4字节长度的UTF-8字符(例如emoji表情),就需要使用 utf8mb4 字符集。

如果要写入emoji表情(utf8mb4)到mysql,需要应用客户端、客户端到MySQL的连接、以及MySQL实例内部这三者统一,统一使用支持utf8mb4字符集才行。

否则,mysql的jdbc链接驱动mysql-connetoer会抛异常:

java.sql.SQLException: Incorrect string value: '\xF0\x9F\x98\x84],...' for column 'name' at row 1 


mysql server 5.5.3+ 版本才支持utf8mb4。

mysql> select version();

mysql-connector-5.1.13+版本才支持utf8mb4。


mysq配置文件修改,mysql修改字符集:
[client] 
default-character-set = utf8mb4

[mysql] 
default-character-set = utf8mb4
 
[mysqld]

character-set-server = utf8mb4

#collation-server = utf8mb4_unicode_ci    #测试发现可能不用配置

#init_connect=’SET NAMES utf8mb4’       #测试发现可能不用配置

sql_mode='NO_ENGINE_SUBSTITUTION'


重启mysql


mysql> show variables like '%charact%';

+--------------------------+----------------------------+
| Variable_name            | Value                      |
+--------------------------+----------------------------+
| character_set_client     | utf8mb4                    |
| character_set_connection | utf8mb4                    |
| character_set_database   | utf8mb4                    |
| character_set_filesystem | binary                     |
| character_set_results    | utf8mb4                    |
| character_set_server     | utf8mb4                    |
| character_set_system     | utf8                       |
| character_sets_dir       | /usr/share/mysql/charsets/ |
+--------------------------+----------------------------+
8 rows in set (0.01 sec)

必须保证下面几个正确:
character_set_client (客户端来源数据使用的字符集)
character_set_connection (连接层字符集)
character_set_database (当前选中数据库的默认字符集)
character_set_results (查询结果字符集)
character_set_server (默认的内部操作字符集)

客户端链接测试:

#1: 插入后为乱码:3F3F3F3F
set charset utf8;
insert into test_utf8mb4_src values(9,"test", '??'); #??为直接拷贝的表情符号
select hex(url) from test_utf8mb4_src where id=9;

#2: 插入OK, F09F9884
set charset utf8;
insert into test_utf8mb4_src values(9,"test", 0xF09F9884);
select hex(url) from test_utf8mb4_src where id=9;

#3: 插入OK, F09F9884
set charset utf8;
insert into test_utf8mb4_src values(9,"test", UNHEX('F09F9884'));
select hex(url) from test_utf8mb4_src where id=9;

#4: 插入OK, F09F9884
set charset utf8mb4;
insert into test_utf8mb4_src values(9,"test", '??'); #??为直接拷贝的表情符号
select hex(url) from test_utf8mb4_src where id=9;

#5: 插入OK, F09F9884
set charset utf8mb4;
insert into test_utf8mb4_src values(9,"test", 0xF09F9884);
select hex(url) from test_utf8mb4_src where id=9;

#6: 插入OK, F09F9884
set charset utf8mb4;
insert into test_utf8mb4_src values(9,"test", UNHEX('F09F9884'));
select hex(url) from test_utf8mb4_src where id=9;

----------

总结一下:

不同的配置,有不同测试结果。

1.mysql配置如下,写成功&查询hex值正确
#vim /etc/my.conf
[client]
default-character-set = utf8mb4
[mysql]
default-character-set = utf8mb4
[mysqld]
character-set-server = utf8mb4  #会修改@@character_set_server & @@character_set_database,该参数如果不配置成utf8mb4则无法存储


mysql> show variables like '%char%';
+--------------------------------------+----------------------------+
| Variable_name                        | Value                      |
+--------------------------------------+----------------------------+
| character_set_client                 | utf8mb4                    |
| character_set_connection             | utf8mb4                    |
| character_set_database               | utf8mb4                    |
| character_set_filesystem             | binary                     |
| character_set_results                | utf8mb4                    |
| character_set_server                 | utf8mb4                    |
| character_set_system                 | utf8                       |
...
+--------------------------------------+----------------------------+


2.写入会失败
#vim /etc/my.conf

[client]
default-character-set = utf8
[mysql]
default-character-set = utf8
[mysqld]
character-set-server = utf8 #会修改@@character_set_server & @@character_set_database,该参数如果不配置成utf8mb4则无法存储


mysql> show variables like '%char%';
+--------------------------------------+----------------------------+
| Variable_name                        | Value                      |
+--------------------------------------+----------------------------+
| character_set_client                 | utf8                       |
| character_set_connection             | utf8                       |
| character_set_database               | utf8                       |
| character_set_filesystem             | binary                     |
| character_set_results                | utf8                       |
| character_set_server                 | utf8                       |
| character_set_system                 | utf8                       |
...
+--------------------------------------+----------------------------+

3.其他的配置,可能会导致写入虽然成功,但写入的值(查看hex)不正确。例如:

default-character-set = utf8mb4

character-set-server=utf8


这篇关于mysql/Java服务端对emoji(utf8mb4编码)的支持有关的问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/720841

相关文章

Java中流式并行操作parallelStream的原理和使用方法

《Java中流式并行操作parallelStream的原理和使用方法》本文详细介绍了Java中的并行流(parallelStream)的原理、正确使用方法以及在实际业务中的应用案例,并指出在使用并行流... 目录Java中流式并行操作parallelStream0. 问题的产生1. 什么是parallelS

MySQL数据库双机热备的配置方法详解

《MySQL数据库双机热备的配置方法详解》在企业级应用中,数据库的高可用性和数据的安全性是至关重要的,MySQL作为最流行的开源关系型数据库管理系统之一,提供了多种方式来实现高可用性,其中双机热备(M... 目录1. 环境准备1.1 安装mysql1.2 配置MySQL1.2.1 主服务器配置1.2.2 从

Java中Redisson 的原理深度解析

《Java中Redisson的原理深度解析》Redisson是一个高性能的Redis客户端,它通过将Redis数据结构映射为Java对象和分布式对象,实现了在Java应用中方便地使用Redis,本文... 目录前言一、核心设计理念二、核心架构与通信层1. 基于 Netty 的异步非阻塞通信2. 编解码器三、

SpringBoot基于注解实现数据库字段回填的完整方案

《SpringBoot基于注解实现数据库字段回填的完整方案》这篇文章主要为大家详细介绍了SpringBoot如何基于注解实现数据库字段回填的相关方法,文中的示例代码讲解详细,感兴趣的小伙伴可以了解... 目录数据库表pom.XMLRelationFieldRelationFieldMapping基础的一些代

一篇文章彻底搞懂macOS如何决定java环境

《一篇文章彻底搞懂macOS如何决定java环境》MacOS作为一个功能强大的操作系统,为开发者提供了丰富的开发工具和框架,下面:本文主要介绍macOS如何决定java环境的相关资料,文中通过代码... 目录方法一:使用 which命令方法二:使用 Java_home工具(Apple 官方推荐)那问题来了,

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述:HashMap的宏观结构二、核心数据结构解析1. 数组(桶数组)2. 链表节点(Node

Java AOP面向切面编程的概念和实现方式

《JavaAOP面向切面编程的概念和实现方式》AOP是面向切面编程,通过动态代理将横切关注点(如日志、事务)与核心业务逻辑分离,提升代码复用性和可维护性,本文给大家介绍JavaAOP面向切面编程的概... 目录一、AOP 是什么?二、AOP 的核心概念与实现方式核心概念实现方式三、Spring AOP 的关

详解SpringBoot+Ehcache使用示例

《详解SpringBoot+Ehcache使用示例》本文介绍了SpringBoot中配置Ehcache、自定义get/set方式,并实际使用缓存的过程,文中通过示例代码介绍的非常详细,对大家的学习或者... 目录摘要概念内存与磁盘持久化存储:配置灵活性:编码示例引入依赖:配置ehcache.XML文件:配置

Java 虚拟线程的创建与使用深度解析

《Java虚拟线程的创建与使用深度解析》虚拟线程是Java19中以预览特性形式引入,Java21起正式发布的轻量级线程,本文给大家介绍Java虚拟线程的创建与使用,感兴趣的朋友一起看看吧... 目录一、虚拟线程简介1.1 什么是虚拟线程?1.2 为什么需要虚拟线程?二、虚拟线程与平台线程对比代码对比示例:三

IDEA和GIT关于文件中LF和CRLF问题及解决

《IDEA和GIT关于文件中LF和CRLF问题及解决》文章总结:因IDEA默认使用CRLF换行符导致Shell脚本在Linux运行报错,需在编辑器和Git中统一为LF,通过调整Git的core.aut... 目录问题描述问题思考解决过程总结问题描述项目软件安装shell脚本上git仓库管理,但拉取后,上l