数据挖掘下的内存处理程序运行数据卡顿的方法:虚存扩展

本文主要是介绍数据挖掘下的内存处理程序运行数据卡顿的方法:虚存扩展,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

近期学习汤小丹老师的《计算机操作系统》收获颇多,联想到之前有朋友说:Python比R语言好,原因是Python能处理的数据量比R语言大,在我看来二者并没有谁好谁差,只是看谁能用的好,谁用的频率大而已。

当数据量较大的时候,想是得需要借助多台计算机并行跨节点的方式才能处理。例如,目前已经有了PySpark 、SparkR等的分布式处理方法。

情况描述

1.使用软件对数据进行计算,常常伴随会出现执行时间长,数据卡顿的现象。

2.计算机执行程序的时候,通常在内存保存待处理的数据。程序是为了实现一个特定的目标而预先设计的一组可操作的工作步骤,就可以称为一个程序。对于计算机系统,程序就是系统可以识别的一组有序的指令。

3.这组指令指挥这计算机系统工作。对于计算机系统,简单的说,程序就是系统可以识别的一组有序的指令。程序存储在磁盘上,被加载到内存中,计算机系统从内存中逐条读取指令并执行。

因此数据卡顿这个原因是由于数据计算内存在进行控制,数据量的计算是在内存中发生,那内存的数量是一定的,怎么可能不会卡顿呢?

如何对数据计算过程中的卡顿进行一些改善,于是引入了计算机的虚存概念。

虚存的概念

**把内存与外存有机的结合起来使用,从而得到一个容量很大的“内存”,这是虚拟内存。**进程不完全载入,就叫虚存。可以分成按需取页和按需取段两种方式。

如果用户编制程序时,可以不考虑内存的实际容量,即允许程序中的逻辑地址空间大于内存的绝对地址空间,那么,会使用户感到极大的方便。存储管理利用磁盘作为内存的后援,当一个大型的程序要装入内存时,仅把当前需要的部分装入,其余部分暂留在磁盘上。程序执行中要用到不在内存中的信息时,再由操作系统将其装入内存。如果内存空间不够,则可由操作系统采用覆盖技术。这样,用户就感到计算机系统提供了容量极大的内存空间。实际上,这个容量极大的内存空间不是物理意义上的内存,而是操作系统中的一种存储管理方式,这种方式为用户提供的是一个虚拟的存储器。虚拟存储器比实际内存的容量大,起到了扩充内存空间的作用。

虚存的实际应用

以R语言为例,查看系统中对R语言能够处理的数据分配内存限制进行查看,使用memory.limit(),得到R语言的内存限制为8073,约为7.8G,和我计算机的最大内存接近,R语言在使用内存室,并没有多大的限制。
在这里插入图片描述

此时,R语言的内存使用是7.8G,这和系统的内存几乎相同,是不是意味着,内存没有办法进行增加?此时,可以进一步借助虚拟内存对R语言的内存进行扩增。输入memory.limit(102400),就直接把系统分配给R语言的内存使用上限调到100G。如下所示:
在这里插入图片描述

那这样操作是不是合理呢?并不是的,还需要在windows中对数据的虚拟内存进行适当上限的调整才可以。
在这里插入图片描述
对以上进行设置后,重启计算机,默认的虚拟内存就成功了。

不过再用R语言处理数据,需要每次新打开R语言之前都要运行memory.limit(102400)一下。

使用memory.size()查看现在的workspace的内存使用情况和之前的内存情况是否相同。

memory.limit()
memory.limit(102400)
memory.size()

在这里插入图片描述

当再次使用该软件对数据进行分析和运算时,试试看,数据的处理速度,可谓之:千里江陵~~

这篇关于数据挖掘下的内存处理程序运行数据卡顿的方法:虚存扩展的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/801967

相关文章

一文教你Python如何快速精准抓取网页数据

《一文教你Python如何快速精准抓取网页数据》这篇文章主要为大家详细介绍了如何利用Python实现快速精准抓取网页数据,文中的示例代码简洁易懂,具有一定的借鉴价值,有需要的小伙伴可以了解下... 目录1. 准备工作2. 基础爬虫实现3. 高级功能扩展3.1 抓取文章详情3.2 保存数据到文件4. 完整示例

使用Java将各种数据写入Excel表格的操作示例

《使用Java将各种数据写入Excel表格的操作示例》在数据处理与管理领域,Excel凭借其强大的功能和广泛的应用,成为了数据存储与展示的重要工具,在Java开发过程中,常常需要将不同类型的数据,本文... 目录前言安装免费Java库1. 写入文本、或数值到 Excel单元格2. 写入数组到 Excel表格

Java 中的 @SneakyThrows 注解使用方法(简化异常处理的利与弊)

《Java中的@SneakyThrows注解使用方法(简化异常处理的利与弊)》为了简化异常处理,Lombok提供了一个强大的注解@SneakyThrows,本文将详细介绍@SneakyThro... 目录1. @SneakyThrows 简介 1.1 什么是 Lombok?2. @SneakyThrows

判断PyTorch是GPU版还是CPU版的方法小结

《判断PyTorch是GPU版还是CPU版的方法小结》PyTorch作为当前最流行的深度学习框架之一,支持在CPU和GPU(NVIDIACUDA)上运行,所以对于深度学习开发者来说,正确识别PyTor... 目录前言为什么需要区分GPU和CPU版本?性能差异硬件要求如何检查PyTorch版本?方法1:使用命

python处理带有时区的日期和时间数据

《python处理带有时区的日期和时间数据》这篇文章主要为大家详细介绍了如何在Python中使用pytz库处理时区信息,包括获取当前UTC时间,转换为特定时区等,有需要的小伙伴可以参考一下... 目录时区基本信息python datetime使用timezonepandas处理时区数据知识延展时区基本信息

Qt实现网络数据解析的方法总结

《Qt实现网络数据解析的方法总结》在Qt中解析网络数据通常涉及接收原始字节流,并将其转换为有意义的应用层数据,这篇文章为大家介绍了详细步骤和示例,感兴趣的小伙伴可以了解下... 目录1. 网络数据接收2. 缓冲区管理(处理粘包/拆包)3. 常见数据格式解析3.1 jsON解析3.2 XML解析3.3 自定义

SpringMVC 通过ajax 前后端数据交互的实现方法

《SpringMVC通过ajax前后端数据交互的实现方法》:本文主要介绍SpringMVC通过ajax前后端数据交互的实现方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价... 在前端的开发过程中,经常在html页面通过AJAX进行前后端数据的交互,SpringMVC的controll

Java中的工具类命名方法

《Java中的工具类命名方法》:本文主要介绍Java中的工具类究竟如何命名,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录Java中的工具类究竟如何命名?先来几个例子几种命名方式的比较到底如何命名 ?总结Java中的工具类究竟如何命名?先来几个例子JD

Spring Security自定义身份认证的实现方法

《SpringSecurity自定义身份认证的实现方法》:本文主要介绍SpringSecurity自定义身份认证的实现方法,下面对SpringSecurity的这三种自定义身份认证进行详细讲解,... 目录1.内存身份认证(1)创建配置类(2)验证内存身份认证2.JDBC身份认证(1)数据准备 (2)配置依

python获取网页表格的多种方法汇总

《python获取网页表格的多种方法汇总》我们在网页上看到很多的表格,如果要获取里面的数据或者转化成其他格式,就需要将表格获取下来并进行整理,在Python中,获取网页表格的方法有多种,下面就跟随小编... 目录1. 使用Pandas的read_html2. 使用BeautifulSoup和pandas3.