oneAPI 数学核心函数库 (oneMKL):加速数学处理例程 提高应用程序性能 缩短开发时间

本文主要是介绍oneAPI 数学核心函数库 (oneMKL):加速数学处理例程 提高应用程序性能 缩短开发时间,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 在 CPU 和 GPU 上进行数值计算的高性能
  • 为什么选择oneMKL?
  • 最新消息
  • 所需条件
  • 特征
    • 线性代数
    • 稀疏线性代数函数
    • 快速傅里叶变换 (FFT)
    • 随机数生成器函数 (RNG)
    • 数据拟合
    • 矢量数学
    • 汇总统计

英特尔® oneAPI 数学核心函数库 (oneMKL)可以加速数学处理例程,提高应用程序性能,并缩短开发时间。

在 CPU 和 GPU 上进行数值计算的高性能

快速、高效、易于使用的数学库
针对 Intel® CPU、GPU 和其他加速器进行了优化
多功能、强大的功能,用于:密集线性代数稀疏线性代数快速傅里叶变换 (FFT)矢量数学 (VM)随机数生成器 (RNG)汇总统计

为什么选择oneMKL?

适用于基于英特尔®的系统的最快和最常用的数学库。†
更快地创建高性能应用程序。
充分利用面向 AI、HPC 和数据科学的英特尔硬件功能。
从以前的解决方案(英特尔® MKL)无缝升级。
使用 NumPy、SciPy、MATLAB* 等数学解决方案实现高性能。
对 BLAS、LAPACK 和 FFTW 的全面标准接口支持。

最新消息

对 SYCL* 的 oneMKL 库进行了分区,以便为 oneMKL 的开发人员和用户提供更小的二进制占用空间
提高了英特尔 CPU 和 GPU 上的 CUDA* 库函数 API 兼容性覆盖率
提供针对英特尔®至强® CPU Max 系列和英特尔®数据中心 GPU Max 系列优化的高性能 LINPACK (HPL) 和 HPL-AI 基准测试
BLAS的
改进了英特尔数据中心 GPU Max 系列上 GEMV 和多个 BLAS 1 级例程的一般性能
DFT型
在英特尔数据中心 GPU Max 系列上支持大于 4 GiB(高达 64 GiB 数据)的 FFT
改进了英特尔数据中心 GPU Max 系列的 FFT 性能
拉包
引入 SYCL API,用于计算具有 C 和 Fortran OpenMP* 卸载支持的非枢轴 LU 分解
引入 SYCL API 来计算一组通用矩阵的批处理矩阵逆
矢量数学
将矢量数学优化集成到随机数生成器中,以实现高性能计算
支持 Intel GPU 上 FP16 数据类型的矢量数学运算
添加了 OpenMP 5.1 以支持 C 卸载

所需条件

首先为您的应用程序选择最佳接口:
C 接口
Fortran 接口
SYCL 接口

oneMKL 作为英特尔® oneAPI Base Toolkit 的一部分提供。
将 oneMKL 与英特尔® MPI 库或英特尔® Fortran 编译器结合使用需要英特尔® HPC 工具包。
在这里插入图片描述

特征

线性代数

使用对向量和矩阵进行操作的低级例程加速线性代数计算,并与以下行业标准的 BLAS 和 LAPACK 操作兼容:

第 1 级:向量-向量操作
第 2 级:矩阵向量运算
第 3 级:矩阵-矩阵运算

稀疏线性代数函数

使用低级和 inspector-executor 例程对稀疏矩阵执行各种操作,包括:

将稀疏矩阵与密集向量相乘
将稀疏矩阵乘以密集矩阵
使用三角稀疏矩阵求解线性系统
使用一般稀疏矩阵求解线性系统

快速傅里叶变换 (FFT)

将信号从其原始域(通常是时间或空间)转换为频域中的表示并返回。在一维、二维或三维中使用 FFT 函数,并支持混合 radice。支持的功能包括单精度和双精度任意长度的复数到复数和实数到复数的变换。

随机数生成器函数 (RNG)

使用常见的伪随机、准随机和非确定性随机数引擎来求解连续分布和离散分布。

数据拟合

提供基于样条的插值功能,可用于近似函数、函数导数或积分,以及执行单元格搜索操作。

矢量数学

通过基于矢量的基本函数平衡精度和性能。使用传统的代数和三角函数操作值。

汇总统计

计算单精度和双精度多维数据集的基本统计估计值(例如原始或中心总和矩)。

这篇关于oneAPI 数学核心函数库 (oneMKL):加速数学处理例程 提高应用程序性能 缩短开发时间的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/779877

相关文章

电脑提示xlstat4.dll丢失怎么修复? xlstat4.dll文件丢失处理办法

《电脑提示xlstat4.dll丢失怎么修复?xlstat4.dll文件丢失处理办法》长时间使用电脑,大家多少都会遇到类似dll文件丢失的情况,不过,解决这一问题其实并不复杂,下面我们就来看看xls... 在Windows操作系统中,xlstat4.dll是一个重要的动态链接库文件,通常用于支持各种应用程序

SQL Server数据库死锁处理超详细攻略

《SQLServer数据库死锁处理超详细攻略》SQLServer作为主流数据库管理系统,在高并发场景下可能面临死锁问题,影响系统性能和稳定性,这篇文章主要给大家介绍了关于SQLServer数据库死... 目录一、引言二、查询 Sqlserver 中造成死锁的 SPID三、用内置函数查询执行信息1. sp_w

Java对异常的认识与异常的处理小结

《Java对异常的认识与异常的处理小结》Java程序在运行时可能出现的错误或非正常情况称为异常,下面给大家介绍Java对异常的认识与异常的处理,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参... 目录一、认识异常与异常类型。二、异常的处理三、总结 一、认识异常与异常类型。(1)简单定义-什么是

Python并行处理实战之如何使用ProcessPoolExecutor加速计算

《Python并行处理实战之如何使用ProcessPoolExecutor加速计算》Python提供了多种并行处理的方式,其中concurrent.futures模块的ProcessPoolExecu... 目录简介完整代码示例代码解释1. 导入必要的模块2. 定义处理函数3. 主函数4. 生成数字列表5.

Python实例题之pygame开发打飞机游戏实例代码

《Python实例题之pygame开发打飞机游戏实例代码》对于python的学习者,能够写出一个飞机大战的程序代码,是不是感觉到非常的开心,:本文主要介绍Python实例题之pygame开发打飞机... 目录题目pygame-aircraft-game使用 Pygame 开发的打飞机游戏脚本代码解释初始化部

Python包管理工具核心指令uvx举例详细解析

《Python包管理工具核心指令uvx举例详细解析》:本文主要介绍Python包管理工具核心指令uvx的相关资料,uvx是uv工具链中用于临时运行Python命令行工具的高效执行器,依托Rust实... 目录一、uvx 的定位与核心功能二、uvx 的典型应用场景三、uvx 与传统工具对比四、uvx 的技术实

C++ 函数 strftime 和时间格式示例详解

《C++函数strftime和时间格式示例详解》strftime是C/C++标准库中用于格式化日期和时间的函数,定义在ctime头文件中,它将tm结构体中的时间信息转换为指定格式的字符串,是处理... 目录C++ 函数 strftipythonme 详解一、函数原型二、功能描述三、格式字符串说明四、返回值五

使用Python开发一个现代化屏幕取色器

《使用Python开发一个现代化屏幕取色器》在UI设计、网页开发等场景中,颜色拾取是高频需求,:本文主要介绍如何使用Python开发一个现代化屏幕取色器,有需要的小伙伴可以参考一下... 目录一、项目概述二、核心功能解析2.1 实时颜色追踪2.2 智能颜色显示三、效果展示四、实现步骤详解4.1 环境配置4.

从基础到进阶详解Pandas时间数据处理指南

《从基础到进阶详解Pandas时间数据处理指南》Pandas构建了完整的时间数据处理生态,核心由四个基础类构成,Timestamp,DatetimeIndex,Period和Timedelta,下面我... 目录1. 时间数据类型与基础操作1.1 核心时间对象体系1.2 时间数据生成技巧2. 时间索引与数据

Python使用smtplib库开发一个邮件自动发送工具

《Python使用smtplib库开发一个邮件自动发送工具》在现代软件开发中,自动化邮件发送是一个非常实用的功能,无论是系统通知、营销邮件、还是日常工作报告,Python的smtplib库都能帮助我们... 目录代码实现与知识点解析1. 导入必要的库2. 配置邮件服务器参数3. 创建邮件发送类4. 实现邮件