Imgui(2) | macOS 绘制 CPU 占用率曲线

2024-02-15 04:12

本文主要是介绍Imgui(2) | macOS 绘制 CPU 占用率曲线,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Imgui(2) | macOS 绘制 CPU 占用率曲线

文章目录

  • Imgui(2) | macOS 绘制 CPU 占用率曲线
    • 0. 简介
    • 1. 绘制曲线 - 以正弦函数为例
      • 1.1 基于 `sf::RectangleShape` 的渲染 - 不好看,效率低
      • 1.2 基于 `sf::VertexArray` 的绘制
    • 2. 获取和绘制所有 CPU 的占用率
      • 2.1 测试程序 - 用满所有 CPU
      • 2.2 获取 CPU 占用率
      • 2.3 SFML获取和绘制cpu占用率
      • 2.4 效果和小节
    • 3. 增加按钮: 在界面上开启和关闭评测程序
      • 3.1 改造测试代码
      • 3.2 引入 imgui-SFML, 增加按钮
    • 4. 提高绘制频率
    • 5. 总结
    • References

0. 简介

实现一个 CPU 占用率曲线绘制的程序, 并能通过按钮触发评测代码的运行; 跨平台。 使用到了 SFML, imgui-SFML, 以及 macOS 平台特有的 API.

规划:

  1. 绘制曲线 - 以正弦函数为例
  2. 获取和绘制所有 CPU 的占用率
  3. 增加按钮: 在界面上开启和关闭评测程序
  4. 提高绘制频率

started: 2024.02.14 10:30~15:30

1. 绘制曲线 - 以正弦函数为例

y = sin(x) 获得一系列坐标点, 使用 sf::VertexArray 进行绘制, 得到相对平滑的结果, 且渲染效率较高。

1.1 基于 sf::RectangleShape 的渲染 - 不好看,效率低

开始时候我用 sf::RectangleShape 执行单个坐标点的绘制, 存在这些问题:

  • 相邻点之间没有连线,锯齿感明显
  • 每个点调用一次 window.draw(), GPU 利用率不高

请添加图片描述

#include <SFML/Graphics.hpp>int main()
{constexpr int win_width = 800;constexpr int win_height = 600;const std::string title = "cpu consumption curve - SFML";sf::RenderWindow window(sf::VideoMode(win_width, win_height), title);window.setFramerateLimit(10);constexpr int grid_len = 1;int idx = 0;while (window.isOpen()){sf::Event event;while (window.pollEvent(event)){if (event.type == sf::Event::Closed){window.close();}}window.clear();// draw heresf::RectangleShape rect(sf::Vector2f(grid_len, grid_len));rect.setFillColor(sf::Color::Green);for (int i = 0; i < win_width; i++){float x = (i * 1.0 / win_width) * 10 * 3.14;float y = sin(x) * win_height/4 + win_height/2 - grid_len/2;rect.setPosition(i, y); // centerwindow.draw(rect);}window.display();}return 0;
}

1.2 基于 sf::VertexArray 的绘制

在 SFML Tutorial - Designing your own entities with vertex arrays 文档提到, 多次调用 window.draw() 效率很低, 很容易到达显卡极限。 好的做法是使用 sf::Vertext 把要绘制的东西一次性准备好, 只调用一次 window.draw():

SFML provides simple classes for the most common 2D entities. And while more complex entities can easily be created from these building blocks, it isn’t always the most efficient solution. For example, you’ll reach the limits of your graphics card very quickly if you draw a large number of sprites. The reason is that performance depends in large part on the number of calls to the draw function. Indeed, each call involves setting a set of OpenGL states, resetting matrices, changing textures, etc. All of this is required even when simply drawing two triangles (a sprite). This is far from optimal for your graphics card: Today’s GPUs are designed to process large batches of triangles, typically several thousand to millions.

To fill this gap, SFML provides a lower-level mechanism to draw things: Vertex arrays. As a matter of fact, vertex arrays are used internally by all other SFML classes. They allow for a more flexible definition of 2D entities, containing as many triangles as you need. They even allow drawing points or lines.

请添加图片描述

关键代码修改如下:

// draw here
// sf::RectangleShape rect(sf::Vector2f(grid_len, grid_len));
// rect.setFillColor(sf::Color::Green);
// for (int i = 0; i < win_width; i++)
// {
//     float x = (i * 1.0 / win_width) * 10 * 3.14;
//     float y = sin(x) * win_height/8 + win_height/2 - grid_len/2;
//     rect.setPosition(i, y); // center
//     window.draw(rect); // 原来: 在一帧内多次调用 window.draw(), 渲染效率低
// }sf::VertexArray line(sf::LineStrip, win_width);
for (int i = 0; i < win_width; i++)
{float x = (i * 1.0 / win_width) * 10 * 3.14;float y = sin(x) * win_height/8 + win_height/2 - grid_len/2;line[i].position = sf::Vector2f(i, y);line[i].color = sf::Color::Green;
}
window.draw(line); // 现在: 在一帧内只调用一次 window.draw(), 渲染效率高

2. 获取和绘制所有 CPU 的占用率

MacOS 禁止用户自行设定 CPU 亲和性 (Affinity), 尝试过编译运行 “只有 while 死循环” 的程序,占用的 CPU 会跳来跳去。 与其飘忽不定, 不如开启多个线程: 我的 Mac-Mini 有 8 个 CPU, 因此开启 8 个线程, 每个线程都运行一样的死循环代码, 然后获取所有 CPU 的占用率并绘制曲线。

2.1 测试程序 - 用满所有 CPU

在开启 nproc 个线程时, 虽然操作系统不一定是把每个线程分配到不同的 CPU 上, 但电脑整体比较空闲的情况下, 大概率是可以确保这个理想分配的。

性能测试程序代码:

#include <thread>void run()
{int i = 0;while (true){i++;}
}int main()
{constexpr int n = 8;std::thread threads[n];for (int i = 0; i < n; i++){threads[i] = std::thread(run);}for (int i = 0; i < n; i++){threads[i].join();}return 0;
}

2.2 获取 CPU 占用率

参照了 c++获取windows、mac的cpu利用率 这篇文章, 获取了 macOS 下的 CPU 整体占用率, 关键函数是 host_statistics(), 位于 mach/mach_host.h, 但是没有任何注释。 这篇参考博客的做法是, 每隔 1 秒调用一次 host_statistics() 来获得 cpu 相关信息, 两次调用的结果做差值, 得到的差值里的几个时间, 构成了 cpu 占用率:

CPU占用百分比 = (user时间 + system时间 + nice时间) / (上面👆这一坨,再加上 idle 时间) * 100

#include <mach/mach.h>
#include <sys/types.h>
#include <sys/sysctl.h>#define CP_USER   0
#define CP_SYS    1
#define CP_IDLE   2
#define CP_NICE   3
#define CP_STATES 4host_cpu_load_info_data_t load1, load2;host_cpu_load_info_data_t get_cpu_percentage()
{kern_return_t error;mach_msg_type_number_t count;host_cpu_load_info_data_t r_load;mach_port_t mach_port;count = HOST_CPU_LOAD_INFO_COUNT;mach_port = mach_host_self();error = host_statistics(mach_port, HOST_CPU_LOAD_INFO, (host_info_t)&r_load, &count);if (error != KERN_SUCCESS){return host_cpu_load_info_data_t();}return r_load;
}float getCpuUsePercentage()
{load2 = get_cpu_percentage();// pre load timesunsigned long long current_user = load1.cpu_ticks[CP_USER];unsigned long long current_system = load1.cpu_ticks[CP_SYS];unsigned long long current_nice = load1.cpu_ticks[CP_NICE];unsigned long long current_idle = load1.cpu_ticks[CP_IDLE];// Current load timesunsigned long long next_user = load2.cpu_ticks[CP_USER];unsigned long long next_system = load2.cpu_ticks[CP_SYS];unsigned long long next_nice = load2.cpu_ticks[CP_NICE];unsigned long long next_idle = load2.cpu_ticks[CP_IDLE];// Difference between the twounsigned long long diff_user = next_user - current_user;unsigned long long diff_system = next_system - current_system;unsigned long long diff_nice = next_nice - current_nice;unsigned long long diff_idle = next_idle - current_idle;float value = static_cast<float>(diff_user + diff_system + diff_nice) / static_cast<float>(diff_user + diff_system + diff_nice + diff_idle) * 100.0;load1 = load2;return value;
}

2.3 SFML获取和绘制cpu占用率

设置了FPS不超过 60, 每60帧获取一次 CPU 占用率(从而更新需要绘制的数据), 每一帧都绘制当前的 CPU 占用率。

更新数据指的是, 对于绘制任务, 每个数据在时间维度上, 相当于左移一个单位, 因此搬运需要显示的数据数量 num_bins 再减去 1 个的数据,都搬运到它前面一个, 然后填充最后一个数据, 就完成了更新, 在画面上变现为: 原来的 CPU 占用率折线被向左平移了 1 个bin的单位。 每一帧的更新数据和渲染, 代码如下:

    frameIdx++;if (frameIdx % 60 == 0){load2 = get_cpu_percentage();float cpu_use = getCpuUsePercentage();for (int i = 0; i < num_bins - 1; i++){cpu_usage[i] = cpu_usage[i + 1];}cpu_usage[num_bins - 1] = cpu_use;frameIdx = 0;}sf::VertexArray line(sf::LinesStrip, num_bins);for (int i = 0; i < num_bins; i++){float usage = cpu_usage[i];float x = i * bin_size;float y = win_height - (usage / 100) * win_height;line[i].position = sf::Vector2f(x, y);}window.draw(line);printf("cpu_usage[%d] = %f\n", num_bins - 1, cpu_usage[num_bins - 1]);

2.4 效果和小节

通过使用 SFML 和 macOS 的 API, 获取并绘制了总体的 CPU 占用率, 通过编写和开启测试程序, 在开启 4 个线程的情况下, 可以看到 CPU 占用率在 50% 左右:
请添加图片描述

3. 增加按钮: 在界面上开启和关闭评测程序

按钮是 GUI 的组件, 这一节需要使用 imgui 和 imgui-SFML.

3.1 改造测试代码

需要改造评测代码, 让它能够被随时开启和关闭:

  • 在 GUI 方面, 增加 start benchmark 和 stop benchmark 按钮, 来控制测试代码的开启和关闭
  • 在代码实现层面:
    • 重构原有的测试代码,让它的 while(true) 改为 while(running), running 是 std::atomic<bool> 类型
    • 在 SFML 的 main loop 中集成: 增加按钮按下的响应事件
    • 在响应事件函数 startBenchmark()stopBenchmark() 函数中, 通过创建和效果新的线程,在线程中运行、等待测试代码

非阻塞的响应

其中按钮的响应函数中, 如果没有通过新开线程来执行测试代码, 会导致界面卡死。 使用了新开线程后则不会。关键代码:

BenchmarkRunner runner; // 被测试的代码, 封装为了类
std::thread benchmark_thread;void startBenchmark()
{runner.running = true;benchmark_thread = std::thread(&BenchmarkRunner::benchmark, &runner);
}void stopBenchmark()
{runner.running = false;if (benchmark_thread.joinable()){benchmark_thread.join();}
}

重构了的性能测试代码

以 OOP 的方式提供使用:

#pragma once#include <atomic>
#include <thread>class BenchmarkRunner {
public:void benchmark(){constexpr int n = 4;std::thread threads[n];for (int i = 0; i < n; i++){threads[i] = std::thread([this] { this->run(); });}for (int i = 0; i < n; i++){threads[i].join();}}std::atomic<bool> running = true;
private:void run(){int i = 0;while (running){i++;}}
};

3.2 引入 imgui-SFML, 增加按钮

增加两个按钮, 注册它们的响应函数

        ImGui::Begin("Hello"); // [imgui]ImGui::Button("Start Benchmark"); // [imgui]ImGui::Button("Stop Benchmark"); // [imgui]ImGui::End(); // [imgui]if (ImGui::Button("Start Benchmark")){startBenchmark();}if (ImGui::Button("Stop Benchmark")){stopBenchmark();}

main loop增加 imgui-SFML 的套路代码

标记为 [imgui-SFML] 的是新增的套路代码:

int main()
{constexpr int win_width = 800;constexpr int win_height = 600;const std::string title = "cpu consumption curve - SFML";sf::RenderWindow window(sf::VideoMode(win_width, win_height), title);window.setFramerateLimit(60);bool success = ImGui::SFML::Init(window); // [imgui-SFML]if (!success)return -1;constexpr int grid_len = 1;constexpr int bin_size = 10;constexpr int num_bins = win_width / bin_size;std::vector<float> cpu_usage(num_bins, 0);int frameIdx = 0;load1 = get_cpu_percentage();sf::Clock deltaClock;while (window.isOpen()){sf::Event event;while (window.pollEvent(event)){ImGui::SFML::ProcessEvent(window, event); // [imgui-SFML]if (event.type == sf::Event::Closed){window.close();}}ImGui::SFML::Update(window, deltaClock.restart()); // [imgui-SFML]frameIdx++;window.clear();//draw_sin_x_wave(win_width, win_height, grid_len, window);ImGui::Begin("Hello"); // [imgui]ImGui::Button("Start Benchmark"); // [imgui]ImGui::Button("Stop Benchmark"); // [imgui]ImGui::End(); // [imgui]if (ImGui::Button("Start Benchmark")){startBenchmark();}if (ImGui::Button("Stop Benchmark")){stopBenchmark();}if (1){if (frameIdx % 60 == 0){load2 = get_cpu_percentage();float cpu_use = getCpuUsePercentage();for (int i = 0; i < num_bins - 1; i++){cpu_usage[i] = cpu_usage[i + 1];}cpu_usage[num_bins - 1] = cpu_use;frameIdx = 0;}sf::VertexArray line(sf::LinesStrip, num_bins);for (int i = 0; i < num_bins; i++){float usage = cpu_usage[i];float x = i * bin_size;float y = win_height - (usage / 100) * win_height;line[i].position = sf::Vector2f(x, y);}window.draw(line);printf("cpu_usage[%d] = %f\n", num_bins - 1, cpu_usage[num_bins - 1]);}ImGui::SFML::Render(window); // [imgui-SFML]window.display();}return 0;
}

效果如下

当按下了 Start Benchmark 后, CPU 占用率曲线飙升到 50% 左右(因为开了 4 个线程); 当按下 Stop Benchmark 后, 曲线会降低下来:
请添加图片描述

4. 提高绘制频率

github 上找到的 CPU-Profiler 项目, 运行的时候的能够以低于 1 秒的频率更新绘制曲线, 相关实现在 src/Consumption/TotalConsumption.cppsrc/Consumption/TotalConsumption.hpp 中, 和前面提到的 CSDN 参考博客实现方法, 调用了同样的 host_statistics() 函数和参数:

double TotalConsumption::getCurrentValue()
{host_cpu_load_info_data_t cpuInfo;mach_msg_type_number_t count = HOST_CPU_LOAD_INFO_COUNT;if (host_statistics(mach_host_self(), HOST_CPU_LOAD_INFO, (host_info_t)&cpuInfo, &count) == KERN_SUCCESS){unsigned long long totalTicks = 0;for (unsigned cpu_tick : cpuInfo.cpu_ticks)totalTicks += cpu_tick;return calculate(cpuInfo.cpu_ticks[CPU_STATE_IDLE], totalTicks);}elsereturn -1.0f;
}

CPU-Profiler 的绘制很快, 并且没有取值为 0 的 cpu占用率突变点(折线的突然截断没显示,因为数值是 nan), 因为作者判断当执行除法的分母(也就是总时间)是 0 的时候,返回 100.0 而不是 0.0:

float TotalConsumption::calculate(unsigned long long idleTicks,unsigned long long totalTicks)
{auto totalTicksSinceLastTime = totalTicks - _previousTotalTicks;auto idleTicksSinceLastTime  = idleTicks  - _previousIdleTicks;float diff = static_cast<float>(idleTicksSinceLastTime) / totalTicksSinceLastTime;float ans = 1.0f;if (totalTicksSinceLastTime > 0)ans -= diff;_previousTotalTicks = totalTicks;_previousIdleTicks  = idleTicks;return ans * 100;
}

我们照搬这个做法到自己的代码:


float getCpuUsePercentage()
{load2 = get_cpu_percentage();// pre load timesunsigned long long current_user = load1.cpu_ticks[CP_USER];unsigned long long current_system = load1.cpu_ticks[CP_SYS];unsigned long long current_nice = load1.cpu_ticks[CP_NICE];unsigned long long current_idle = load1.cpu_ticks[CP_IDLE];// Current load timesunsigned long long next_user = load2.cpu_ticks[CP_USER];unsigned long long next_system = load2.cpu_ticks[CP_SYS];unsigned long long next_nice = load2.cpu_ticks[CP_NICE];unsigned long long next_idle = load2.cpu_ticks[CP_IDLE];// Difference between the twounsigned long long diff_user = next_user - current_user;unsigned long long diff_system = next_system - current_system;unsigned long long diff_nice = next_nice - current_nice;unsigned long long diff_idle = next_idle - current_idle;load1 = load2;float total = diff_user + diff_system + diff_nice + diff_idle;if (total > 0) // 如果没有判断 total > 0, total 有时候是 0,会导致 value 是 nan,进而出现cpu占用率折线图的 突然截断{return static_cast<float>(diff_user + diff_system + diff_nice) / static_cast<float>(total) * 100.0;}return 100.0;
}

对我我的实现和 CPU-Profiler 的实现:
请添加图片描述

5. 总结

本篇使用 C++ 实现了一个简陋的 CPU 占用率界面程序, 给出了实现的关键部件, 以及一些探索过程。

从界面上看, 能够绘制所有 CPU 的总体占用率曲线, 并且按照1 秒(或更短)为间隔,更新CPU占用率的值并绘制折线; 通过提供两个按钮,触发独立的线程来执行 “benchmark 测试程序”。使用独立线程的原因是为了避免阻塞 UI 显示的主线程。

所谓 benchmark 测试程序, 是基于《编程之美》一书开头提到的控制 CPU 占用率曲线的问题, 写了一个让单个CPU占用率 100%、 通过多线程运行, 从而让多个 CPU 核心的占用率都到 100%。 使用多个线程的原因是 macOS 不提供 CPU 绑核(亲和性)的 API, 为了防止测试程序在不同 CPU 上乱跳, 索性多开几个线程来运行。

从界面的实现来看:

  • 首先基于 SFML 绘制了曲线, 由于要绘制多个点, sf::VertexArray 的绘制效率远远高于 sf::RectangleShape, 前者只需要一次绘制, 后者则需要 n 次绘制, 可以在 SFML Tutorial - Designing your own entities with vertex arrays 文章中得到解释。

  • 然后使用 macOS 的 API host_statistics() 的封装代码, 通过前后两次计算差值来获取 CPU 占用率。 对于差值的计算, 时间间隔不能太快, 太快的话会获取到总时间为0, 参考了 CPU-Profiler 的做法, 也就是此时的 CPU 占用率赋值为100%, 这其实并不准确。

  • 为了减少评测代码和 CPU占用率绘图代码的切换繁琐问题, 在GUI上创建了按钮,通过按钮触发了性能测试程序的启动和停止。 这些按钮的添加, 按钮本身是 imgui 的东西, 通过 imgui-SFML 框架, 得以和原本的 SFML 窗口渲染程序结合显示。

这个程序并不完美, 比如只支持了 macOS 而没有支持 Windows/Linux, 评测程序过于简单只做了100% CPU 占用的实现、 没有实现正弦曲线的绘制。有空会考虑补充实现。

References

  • SFML Tutorial - Designing your own entities with vertex arrays
  • c++获取windows、mac的cpu利用率
  • CPU-Profiler
  • host_statistics - Apple Docs

这篇关于Imgui(2) | macOS 绘制 CPU 占用率曲线的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/710418

相关文章

一篇文章彻底搞懂macOS如何决定java环境

《一篇文章彻底搞懂macOS如何决定java环境》MacOS作为一个功能强大的操作系统,为开发者提供了丰富的开发工具和框架,下面:本文主要介绍macOS如何决定java环境的相关资料,文中通过代码... 目录方法一:使用 which命令方法二:使用 Java_home工具(Apple 官方推荐)那问题来了,

Python绘制TSP、VRP问题求解结果图全过程

《Python绘制TSP、VRP问题求解结果图全过程》本文介绍用Python绘制TSP和VRP问题的静态与动态结果图,静态图展示路径,动态图通过matplotlib.animation模块实现动画效果... 目录一、静态图二、动态图总结【代码】python绘制TSP、VRP问题求解结果图(包含静态图与动态图

macOS彻底卸载Python的超完整指南(推荐!)

《macOS彻底卸载Python的超完整指南(推荐!)》随着python解释器的不断更新升级和项目开发需要,有时候会需要升级或者降级系统中的python的版本,系统中留存的Pytho版本如果没有卸载干... 目录MACOS 彻底卸载 python 的完整指南重要警告卸载前检查卸载方法(按安装方式)1. 卸载

修复已被利用的高危漏洞! macOS Sequoia 15.6.1发布

《修复已被利用的高危漏洞!macOSSequoia15.6.1发布》苹果公司于今日发布了macOSSequoia15.6.1更新,这是去年9月推出的macOSSequoia操作... MACOS Sequoia 15.6.1 正式发布!此次更新修复了一个已被黑客利用的严重安全漏洞,并解决了部分中文用户反馈的

SysMain服务可以关吗? 解决SysMain服务导致的高CPU使用率问题

《SysMain服务可以关吗?解决SysMain服务导致的高CPU使用率问题》SysMain服务是超级预读取,该服务会记录您打开应用程序的模式,并预先将它们加载到内存中以节省时间,但它可能占用大量... 在使用电脑的过程中,CPU使用率居高不下是许多用户都遇到过的问题,其中名为SysMain的服务往往是罪魁

MySQL中优化CPU使用的详细指南

《MySQL中优化CPU使用的详细指南》优化MySQL的CPU使用可以显著提高数据库的性能和响应时间,本文为大家整理了一些优化CPU使用的方法,大家可以根据需要进行选择... 目录一、优化查询和索引1.1 优化查询语句1.2 创建和优化索引1.3 避免全表扫描二、调整mysql配置参数2.1 调整线程数2.

在macOS上安装jenv管理JDK版本的详细步骤

《在macOS上安装jenv管理JDK版本的详细步骤》jEnv是一个命令行工具,正如它的官网所宣称的那样,它是来让你忘记怎么配置JAVA_HOME环境变量的神队友,:本文主要介绍在macOS上安装... 目录前言安装 jenv添加 JDK 版本到 jenv切换 JDK 版本总结前言China编程在开发 Java

Linux进程CPU绑定优化与实践过程

《Linux进程CPU绑定优化与实践过程》Linux支持进程绑定至特定CPU核心,通过sched_setaffinity系统调用和taskset工具实现,优化缓存效率与上下文切换,提升多核计算性能,适... 目录1. 多核处理器及并行计算概念1.1 多核处理器架构概述1.2 并行计算的含义及重要性1.3 并

Linux下进程的CPU配置与线程绑定过程

《Linux下进程的CPU配置与线程绑定过程》本文介绍Linux系统中基于进程和线程的CPU配置方法,通过taskset命令和pthread库调整亲和力,将进程/线程绑定到特定CPU核心以优化资源分配... 目录1 基于进程的CPU配置1.1 对CPU亲和力的配置1.2 绑定进程到指定CPU核上运行2 基于

使用Python绘制3D堆叠条形图全解析

《使用Python绘制3D堆叠条形图全解析》在数据可视化的工具箱里,3D图表总能带来眼前一亮的效果,本文就来和大家聊聊如何使用Python实现绘制3D堆叠条形图,感兴趣的小伙伴可以了解下... 目录为什么选择 3D 堆叠条形图代码实现:从数据到 3D 世界的搭建核心代码逐行解析细节优化应用场景:3D 堆叠图