编码修炼之性能优化

2024-09-02 12:32
文章标签 优化 性能 编码 修炼

本文主要是介绍编码修炼之性能优化,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 概述
    • 明确问题
    • 跟踪数据
    • 定位
      • CPU占用高
      • 内存泄漏
      • OOM
      • 数据库连接
    • 分析优化
  • 涉及面
    • code
  • 系统工具
    • CPU使用率
    • 磁盘使用率
    • 网络使用率
  • jvm
  • jvm监控工具
    • jcmd
    • jconsole
    • jhat
    • jstack
    • jvisualvm
  • sql

性能优化是个很大的命题,后期不断补充

概述

总统思路包括:
明确问题—跟踪数据—定位—分析优化

明确问题

出现的性能问题常包括单点性能问题和并发问题。一般来说,单点问题在并发场景有极大概率同样发生。
JProfiler,或者jcmd进行定位;
抓取线程快照分析耗时
数据库session,process,sql分析器 DBSQLMonitor,

跟踪数据

定位

CPU占用高

抓取现场堆栈

top
top -H 查看cpu占用top线程
printf "%x\n" pid   将pid转成nid
根据nid从线程堆栈中查看top cpu线程信息

内存泄漏

JProfile
JConsole
JCmd jcmd PID GC.class_histogram >> tracelog.log ; jcmd PID Thread.print >> tracelog.log

OOM

数据库连接

获取Session会话状态及执行的SQLScript
Session Dump

分析优化

对于有metrics度量的应用或者通过arthas进行程序定位

参考:
java性能权威指南

涉及面

code

代码的性能优化是个很大的话题,但是要讨论这个话题是和代码质量分不开的。有良好的编程习惯和编码规范是个前提,其他的可以在算法和结构上下下功夫。不过,千万不要忘记解耦哦。
同时,可以使用JMH这要的工具在UT阶段,多分析一下性能瓶颈,线上的可以用arthas查看一下性能,响应时长的问题。
经常要考虑的点:

  1. 线程同步/锁
  2. 循环代码优化
  3. 数据库连接池,以及这些池化资源的线程数,避免大量线程等待
  4. 内存提前分配,如hashmap
  5. 字符串拼接
  6. 位运算提速

千万不要忘记在网络环境中,网络和IO才是限制吞吐量的大头
在代码的编程实践中,“少即是多”是一条至理名言。
要编译的代码越多,等待程序启动所耗费的时间就越长;
要创建和销毁的对象越多,垃圾收集的工作量就越大;
要分配和持有的对象越多,GC的周期就越长;
要从磁盘装载进JVM的类越多,程序启动所花费的时间就越长;
要执行的代码越多,机器硬件缓存的效率就越低;而执行的代码越多,花费的时间就越长。

对于代码层的性能优化,我们可以通过arthas的trace,monitor进行监控判断。如果应用启用了APM这个部分的度量信息会更加直观。

系统工具

CPU使用率

vmstat 1

磁盘使用率

iostat

网络使用率

netstat

jvm

要注意,jvm在性能优化中只占比较小的一部分。
到jvm的优化情况一般比较少,尤其是在微服务开发场景中,我们用的jre镜像大部分是开源官方版或者是公司统一规范的镜像,这一般是架构师处理的,需要程序员实操的机会不太多。但是,如果遇到了这种情况,一般考虑一下几个方面:

  • 内存分代

-Xms4G 是指: JVM启动时整个堆(包括年轻代,年老代)的初始化大小。

-Xmx4G 是指: JVM启动时整个堆的最大值。

-Xmn2G是指:年轻代的空间大小,剩下的是年老代的空间。

  • 垃圾回收器

-XX:+UseConcMarkSweepGC是指:使用GC的回收类型。这里是CMS类型,JDK1.7以后推荐使用
+UseG1GC,被称为G1类型(或Garbage First)的回收器。

很多情况下是选择提高整个jvm的内存大小。注意jvm参数有不少默认值,实践中这些默认值是否合适,是值得考虑的。

jvm监控工具

jcmd

它用来打印Java进程所涉及的基本类、线程和VM信息
在这里插入图片描述

jconsole

提供JVM活动的图形化视图,包括线程的使用、类的使用和GC活动。

jhat

读取内存堆转储,并有助于分析

jstack

提供GC和类装载活动的信息

jvisualvm

监视JVM的GUI工具,可用来剖析运行的应用,分析JVM堆转储(事后活动,虽然jvisualvm也可以实时抓取程序的堆转储)

sql

https://blog.csdn.net/qq_38789941/article/details/83744271

1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。

2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如:
select id from t where num is null
可以在num上设置默认值0,确保表中num列没有null值,然后这样查询:
select id from t where num=0
如果查询表的数据量较少也会走全表扫描,这种情况要多profile查看一下索引打到哪里了,可空字段不是不能添加索引,这一点要注意

3.应尽量避免在 where 子句中使用!=或<>操作符,否则将引擎放弃使用索引而进行全表扫描。

4.应尽量避免在 where 子句中使用 or 来连接条件,否则将导致引擎放弃使用索引而进行全表扫描,如:
select id from t where num=10 or num=20
可以这样查询:
select id from t where num=10
union all
select id from t where num=20

5.in 和 not in 也要慎用,否则会导致全表扫描,如:
select id from t where num in(1,2,3)
对于连续的数值,能用 between 就不要用 in 了:
select id from t where num between 1 and 3

6.下面的查询也将导致全表扫描:
select id from t where name like ‘%abc%’ — 要遵循最左查询原则

7.应尽量避免在 where 子句中对字段进行表达式操作,这将导致引擎放弃使用索引而进行全表扫描。如:
select id from t where num/2=100
应改为:
select id from t where num=100*2

8.应尽量避免在where子句中对字段进行函数操作,这将导致引擎放弃使用索引而进行全表扫描。如:
select id from t where substring(name,1,3)=‘abc’–name以abc开头的id
应改为:
select id from t where name like ‘abc%’

9.不要在 where 子句中的“=”左边进行函数、算术运算或其他表达式运算,否则系统将可能无法正确使用索引。

10.在使用索引字段作为条件时,如果该索引是复合索引,那么必须使用到该索引中的第一个字段作为条件时才能保证系统使用该索引,否则该索引将不会被使用,并且应尽可能的让字段顺序与索引顺序相一致。

11.不要写一些没有意义的查询,如需要生成一个空表结构:
select col1,col2 into #t from t where 1=0
这类代码不会返回任何结果集,但是会消耗系统资源的,应改成这样:
create table #t(…)

12.很多时候用 exists 代替 in 是一个好的选择:
select num from a where num in(select num from b)
用下面的语句替换:
select num from a where exists(select 1 from b where num=a.num)

13.并不是所有索引对查询都有效,SQL是根据表中数据来进行查询优化的,当索引列有大量数据重复时,SQL查询可能不会去利用索引,如一表中有字段sex,male、female几乎各一半,那么即使在sex上建了索引也对查询效率起不了作用。

14.索引并不是越多越好,索引固然可以提高相应的 select 的效率,但同时也降低了 insert 及 update 的效率,
因为 insert 或 update 时有可能会重建索引,所以怎样建索引需要慎重考虑,视具体情况而定。
一个表的索引数最好不要超过6个,若太多则应考虑一些不常使用到的列上建的索引是否有必要。

15.尽量使用数字型字段,若只含数值信息的字段尽量不要设计为字符型,这会降低查询和连接的性能,并会增加存储开销。
这是因为引擎在处理查询和连接时会逐个比较字符串中每一个字符,而对于数字型而言只需要比较一次就够了。

16.尽可能的使用 varchar 代替 char ,因为首先变长字段存储空间小,可以节省存储空间,
其次对于查询来说,在一个相对较小的字段内搜索效率显然要高些。

17.任何地方都不要使用 select * from t ,用具体的字段列表代替“*”,不要返回用不到的任何字段。

18.避免频繁创建和删除临时表,以减少系统表资源的消耗。

19.临时表并不是不可使用,适当地使用它们可以使某些例程更有效,例如,当需要重复引用大型表或常用表中的某个数据集时。但是,对于一次性事件,最好使用导出表。

20.在新建临时表时,如果一次性插入数据量很大,那么可以使用 select into 代替 create table,避免造成大量 log ,
以提高速度;如果数据量不大,为了缓和系统表的资源,应先create table,然后insert。

21.如果使用到了临时表,在存储过程的最后务必将所有的临时表显式删除,先 truncate table ,然后 drop table ,这样可以避免系统表的较长时间锁定。

22.尽量避免使用游标,因为游标的效率较差,如果游标操作的数据超过1万行,那么就应该考虑改写。

23.使用基于游标的方法或临时表方法之前,应先寻找基于集的解决方案来解决问题,基于集的方法通常更有效。

24.与临时表一样,游标并不是不可使用。对小型数据集使用 FAST_FORWARD 游标通常要优于其他逐行处理方法,尤其是在必须引用几个表才能获得所需的数据时。
在结果集中包括“合计”的例程通常要比使用游标执行的速度快。如果开发时间允许,基于游标的方法和基于集的方法都可以尝试一下,看哪一种方法的效果更好。

25.尽量避免大事务操作,提高系统并发能力。

26.尽量避免向客户端返回大数据量,若数据量过大,应该考虑相应需求是否合理。
27.合理规划索引: 驱动表被驱动表相关字段索引,排序字段
28.避免低效写法: 过滤条件出现在表达式或者函数中,合理等价改写
29. 避免因素类型转换
30. 避免不必要开销,结果集最小化
31. 尽量不用触发器

在生产实践中发生过好几次java程序在多次数据库操作导致程序响应缓慢的情况,一般的这样问题可以通过将单个执行的sql语句改为批量发送给数据库,降低数据库连接的资源消耗。但是在强事务场景中慎用。

这篇关于编码修炼之性能优化的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1129956

相关文章

MyBatisPlus如何优化千万级数据的CRUD

《MyBatisPlus如何优化千万级数据的CRUD》最近负责的一个项目,数据库表量级破千万,每次执行CRUD都像走钢丝,稍有不慎就引起数据库报警,本文就结合这个项目的实战经验,聊聊MyBatisPl... 目录背景一、MyBATis Plus 简介二、千万级数据的挑战三、优化 CRUD 的关键策略1. 查

JVisualVM之Java性能监控与调优利器详解

《JVisualVM之Java性能监控与调优利器详解》本文将详细介绍JVisualVM的使用方法,并结合实际案例展示如何利用它进行性能调优,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全... 目录1. JVisualVM简介2. JVisualVM的安装与启动2.1 启动JVisualVM2

Java使用MethodHandle来替代反射,提高性能问题

《Java使用MethodHandle来替代反射,提高性能问题》:本文主要介绍Java使用MethodHandle来替代反射,提高性能问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑... 目录一、认识MethodHandle1、简介2、使用方式3、与反射的区别二、示例1、基本使用2、(重要)

SpringBoot中HTTP连接池的配置与优化

《SpringBoot中HTTP连接池的配置与优化》这篇文章主要为大家详细介绍了SpringBoot中HTTP连接池的配置与优化的相关知识,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一... 目录一、HTTP连接池的核心价值二、Spring Boot集成方案方案1:Apache HttpCl

PyTorch高级特性与性能优化方式

《PyTorch高级特性与性能优化方式》:本文主要介绍PyTorch高级特性与性能优化方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、自动化机制1.自动微分机制2.动态计算图二、性能优化1.内存管理2.GPU加速3.多GPU训练三、分布式训练1.分布式数据

基于Go语言实现Base62编码的三种方式以及对比分析

《基于Go语言实现Base62编码的三种方式以及对比分析》Base62编码是一种在字符编码中使用62个字符的编码方式,在计算机科学中,,Go语言是一种静态类型、编译型语言,它由Google开发并开源,... 目录一、标准库现状与解决方案1. 标准库对比表2. 解决方案完整实现代码(含边界处理)二、关键实现细

MySQL中like模糊查询的优化方案

《MySQL中like模糊查询的优化方案》在MySQL中,like模糊查询是一种常用的查询方式,但在某些情况下可能会导致性能问题,本文将介绍八种优化MySQL中like模糊查询的方法,需要的朋友可以参... 目录1. 避免以通配符开头的查询2. 使用全文索引(Full-text Index)3. 使用前缀索

C#实现高性能Excel百万数据导出优化实战指南

《C#实现高性能Excel百万数据导出优化实战指南》在日常工作中,Excel数据导出是一个常见的需求,然而,当数据量较大时,性能和内存问题往往会成为限制导出效率的瓶颈,下面我们看看C#如何结合EPPl... 目录一、技术方案核心对比二、各方案选型建议三、性能对比数据四、核心代码实现1. MiniExcel

Java的"伪泛型"变"真泛型"后对性能的影响

《Java的伪泛型变真泛型后对性能的影响》泛型擦除本质上就是擦除与泛型相关的一切信息,例如参数化类型、类型变量等,Javac还将在需要时进行类型检查及强制类型转换,甚至在必要时会合成桥方法,这篇文章主... 目录1、真假泛型2、性能影响泛型存在于Java源代码中,在编译为字节码文件之前都会进行泛型擦除(ty

解决IDEA报错:编码GBK的不可映射字符问题

《解决IDEA报错:编码GBK的不可映射字符问题》:本文主要介绍解决IDEA报错:编码GBK的不可映射字符问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录IDEA报错:编码GBK的不可映射字符终端软件问题描述原因分析解决方案方法1:将命令改为方法2:右下jav