CentOS 5.x和CentOS 6.x限制单个用户线程数上限的不同行为

2024-01-09 14:08

本文主要是介绍CentOS 5.x和CentOS 6.x限制单个用户线程数上限的不同行为,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在使用HiveServer的过程中,通过一个Java程序向其并发提交多个Job,我们发现在同时提交的任务较多的时候,程序就会莫名其妙地卡住,并报出内存溢出(OOM)的错误,但是经过排查,系统还有数十GB的内存处于FREE状态,JVM的内存上限也非常大,所以可以断定问题的原因并不是因为内存不够,而有其它原因。

根据以往的经验,我们在部署服务器的时候,会设置一个系统最大打开文件数量和系统最大进程(线程)数,这个值我们在root用户下做了如下设置(设置在/etc/security/limits.conf文件中):

[plain] view plain copy 在CODE上查看代码片 派生到我的代码片
  1. *                -       nproc           1024000  
  2. *                -       nofile          1024000 
这样的话,root用户能开启的最大进程(线程)数量就是1024000。但是这个设置能否继承到其它用户的设置上却在CentOS 5.8与CentOS 6.4之间有了差别:


首先,在CentOS 5.8上:

[plain] view plain copy 在CODE上查看代码片 派生到我的代码片
  1. [root@monet00 ~]# useradd testuser  
  2. [root@monet00 ~]# su - testuser  
  3. [testuser@monet00 ~]$ ulimit -u  
  4. 1024000  
  5. [testuser@monet00 ~]$ ulimit -u  
  6. 1024000 
可以看到,新增加的用户成功继承了root设置的系统设置。


然后,在CentOS 6.4上却是:

[html] view plain copy 在CODE上查看代码片 派生到我的代码片
  1. [root@etl-1 ~]# useradd testuser  
  2. [root@etl-1 ~]# su - testuser  
  3. [testuser@etl-1 ~]$ ulimit -u  
  4. 1024 
就是因为这个原因,我们在6.4版本的CentOS上,虽然设置了系统的最大线程数是1024000,但是对于运行HiveServer的hive用户而言,它能够开启最大进程(线程)数仍然是默认的1024个,这样就导致,任务提交比较密集的时候,会出现莫名其妙的失败。至于解决办法,就是加入以下配置,明确对hive用户的配置:
[plain] view plain copy 在CODE上查看代码片 派生到我的代码片
  1. hive   - nofile 1024000  
  2. hive   - nproc  1024000 
这样,在我们放大了提交JOB的并行压力之后,系统也能够完美地运行成功。

从这件事情上可以看出,经验固然重要,但是不能把自己关在这些经验构筑的笼子中,必须常怀怀疑的态度,做完工作之后,一定要再次检查,确保达到我们想要的效果。

这篇关于CentOS 5.x和CentOS 6.x限制单个用户线程数上限的不同行为的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/587378

相关文章

SpringBoot实现不同接口指定上传文件大小的具体步骤

《SpringBoot实现不同接口指定上传文件大小的具体步骤》:本文主要介绍在SpringBoot中通过自定义注解、AOP拦截和配置文件实现不同接口上传文件大小限制的方法,强调需设置全局阈值远大于... 目录一  springboot实现不同接口指定文件大小1.1 思路说明1.2 工程启动说明二 具体实施2

Java中如何正确的停掉线程

《Java中如何正确的停掉线程》Java通过interrupt()通知线程停止而非强制,确保线程自主处理中断,避免数据损坏,线程池的shutdown()等待任务完成,shutdownNow()强制中断... 目录为什么不强制停止为什么 Java 不提供强制停止线程的能力呢?如何用interrupt停止线程s

python 线程池顺序执行的方法实现

《python线程池顺序执行的方法实现》在Python中,线程池默认是并发执行任务的,但若需要实现任务的顺序执行,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋... 目录方案一:强制单线程(伪顺序执行)方案二:按提交顺序获取结果方案三:任务间依赖控制方案四:队列顺序消

Python Flask实现定时任务的不同方法详解

《PythonFlask实现定时任务的不同方法详解》在Flask中实现定时任务,最常用的方法是使用APScheduler库,本文将提供一个完整的解决方案,有需要的小伙伴可以跟随小编一起学习一下... 目录完js整实现方案代码解释1. 依赖安装2. 核心组件3. 任务类型4. 任务管理5. 持久化存储生产环境

基于Python实现数字限制在指定范围内的五种方式

《基于Python实现数字限制在指定范围内的五种方式》在编程中,数字范围限制是常见需求,无论是游戏开发中的角色属性值、金融计算中的利率调整,还是传感器数据处理中的异常值过滤,都需要将数字控制在合理范围... 目录引言一、基础条件判断法二、数学运算巧解法三、装饰器模式法四、自定义类封装法五、NumPy数组处理

SpringBoot实现虚拟线程的方案

《SpringBoot实现虚拟线程的方案》Java19引入虚拟线程,本文就来介绍一下SpringBoot实现虚拟线程的方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,... 目录什么是虚拟线程虚拟线程和普通线程的区别SpringBoot使用虚拟线程配置@Async性能对比H

在Java中实现线程之间的数据共享的几种方式总结

《在Java中实现线程之间的数据共享的几种方式总结》在Java中实现线程间数据共享是并发编程的核心需求,但需要谨慎处理同步问题以避免竞态条件,本文通过代码示例给大家介绍了几种主要实现方式及其最佳实践,... 目录1. 共享变量与同步机制2. 轻量级通信机制3. 线程安全容器4. 线程局部变量(ThreadL

Linux线程同步/互斥过程详解

《Linux线程同步/互斥过程详解》文章讲解多线程并发访问导致竞态条件,需通过互斥锁、原子操作和条件变量实现线程安全与同步,分析死锁条件及避免方法,并介绍RAII封装技术提升资源管理效率... 目录01. 资源共享问题1.1 多线程并发访问1.2 临界区与临界资源1.3 锁的引入02. 多线程案例2.1 为

最新Spring Security的基于内存用户认证方式

《最新SpringSecurity的基于内存用户认证方式》本文讲解SpringSecurity内存认证配置,适用于开发、测试等场景,通过代码创建用户及权限管理,支持密码加密,虽简单但不持久化,生产环... 目录1. 前言2. 因何选择内存认证?3. 基础配置实战❶ 创建Spring Security配置文件

go动态限制并发数量的实现示例

《go动态限制并发数量的实现示例》本文主要介绍了Go并发控制方法,通过带缓冲通道和第三方库实现并发数量限制,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 目录带有缓冲大小的通道使用第三方库其他控制并发的方法因为go从语言层面支持并发,所以面试百分百会问到