Angel 3.2.0新版本出炉!图计算能力再次加强

2024-03-23 18:38

本文主要是介绍Angel 3.2.0新版本出炉!图计算能力再次加强,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Angel项目的3.2.0版本发布啦!

Angel是腾讯首个AI开源项目,经过多个版本迭代,于2019年在Linux基金会顺利毕业。作为面向机器学习的第三代高性能计算平台,Angel提供了全栈的机器学习能力,并致力于解决高维稀疏大模型训练以及大规模分布式图计算的问题

图片

在3.1.0的版本中,Angel首次引入了图计算能力,提供了大量开箱即用的图算法,得到了业界广泛的关注和使用。本次版本发布,Angel继续加强了图计算的能力,相较于上个版本,我们做了很多优化并提供了一些新的特性,感兴趣的话就赶紧下载体验吧,期待你的反馈哦。

主要新特性如下:

图计算分层抽象与灵活扩展

Angel3.1.0版本提供了大量开箱即用的图算法,但在使用过程中,部分用户反馈需要根据自己的业务场景做定制化的二次开发以及新算法的研发。因此我们对图计算框架做了系统性的三层抽象:图计算引擎层、图操作算子层以及图算法层,并在图操作算子层提供了常用的十几种算子抽象如init、get、walker、sample等以及自定义算子接口。基于上述抽象,用户可以快速、灵活地在算法层扩展或实现自定义图算法。

参数服务器与MPI混合运行模式

图算法种类繁多,主要可分为三大类:传统图挖掘算法、图表示学习算法和图神经网络算法,每一种算法都有着不同的计算流程,对计算平台的要求也不一样,这导致图计算解决方案非常的碎片化,很难在一个平台中支持所有类型的算法。Angel是一个基于参数服务器模式的计算平台,在过去的版本中,我们对参数服务器做了大量的优化和功能上的增强:例如算法流程上的优化、自定义PS函数和计算下推等,使得Angel能够同时支撑这三大类算法,并且大部分算法都有着良好的性能,但仍然有少部分算法计算不够高效,这主要受限于参数服务器模式的一些局限性:例如数据交互不够直接、重复存储浪费内存空间、大规模任务连接数爆炸,稠密模型聚合效率不是最优等。鉴于以上原因,我们在3.2.0版本中开始探索下一代图计算框架,尝试将参数服务器模式和MPI模式优势结合起来,具体做法是将Angel PS以嵌入式的方式启动在Worker(或Executor)中,并优化网络通信拓扑,节点之间可以根据算法特征采用最高效的通信方式,在一个模型中可以同时使用PS模式和MPI常见的环状通信拓扑等。这个功能特性目前还处在expermental阶段,3.2.0版本将会首先在游走类算法上做一些尝试。

自适应的模型分区方式

模型的分区路由一般有range和hash两种方式,它们有各自的优缺点,比如range分区方式占用内存少,计算快但是容易造成计算上的负载不均衡且往往需要节点id是数值类型且编码在连续的空间才会比较高效,需要在图训练之前就提前做一些预处理的操作。而hash分区方式能够解决负载不均衡问题,且能支持任意类型的节点id,不需要对图做编码预处理的工作,该分区方式图算法的增量训练也很容易支持,但是其内存占用较多。我们对参数服务器模型分区路由方式做了优化,能够同时支持range和hash的分区,在实际的图算法训练过程中可以根据不同的算法计算特性自适应地选择合适的模型分区方式,有效解决图训练预处理、存储和计算上的负载不均衡以及增量训练等问题。

支持复杂异构Graph Embedding

现实很多业务场景中图网络往往是复杂异构的,一些常见的同构GNN算法很难学到有效的表达,因此需要更加复杂的异构Graph Embedding来解决问题。而图计算平台支持复杂异构GNN算法往往面临着多重挑战:比如复杂异构网络存储问题,网络中可能存在多种不同类型的节点,每个节点又可能有多种属性,每个节点对还可能有多种类型的边以及边有多种属性; 又比如复杂异构网络的计算问题,由于存在多种不同类型的节点、边以及属性,需要提供多种能够支撑复杂操作的算子及其组合进行计算。我们丰富和拓展了图的存储结构和计算模式,针对复杂操作提供灵活的自定义ps func接口,能够良好的支持复杂异构图网络的存储和计算,并且能够支持高维稀疏的图节点特征,可以很容易地进行异构图的表征学习。同时我们也新增了HAN、异构GAT、异构GraphSage、IGMC边预测以及异构Bipartite GraphSage等5个开箱即用的异构图神经网络算法。

千亿边大图的高性能优化

大规模图算法在容错和计算性能上相对的要求也更高,我们针对千亿边大图训练做了专门的性能优化并在现网的共享集群做了性能测试,在K-core和common friends两个算法的测试结果为在内存消耗降低30%的同时,计算性能还有3倍的提升。

图片

机器学习算法库丰富

新增十几种特征工程方法以及1个多任务学习算法esmm

想了解更多细节,请参考官方release notes:

https://github.com/Angel-ML/angel/releases/tag/Release-3.2.0

 

这篇关于Angel 3.2.0新版本出炉!图计算能力再次加强的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/839186

相关文章

使用jenv工具管理多个JDK版本的方法步骤

《使用jenv工具管理多个JDK版本的方法步骤》jenv是一个开源的Java环境管理工具,旨在帮助开发者在同一台机器上轻松管理和切换多个Java版本,:本文主要介绍使用jenv工具管理多个JD... 目录一、jenv到底是干啥的?二、jenv的核心功能(一)管理多个Java版本(二)支持插件扩展(三)环境隔

MySQL版本问题导致项目无法启动问题的解决方案

《MySQL版本问题导致项目无法启动问题的解决方案》本文记录了一次因MySQL版本不一致导致项目启动失败的经历,详细解析了连接错误的原因,并提供了两种解决方案:调整连接字符串禁用SSL或统一MySQL... 目录本地项目启动报错报错原因:解决方案第一个:第二种:容器启动mysql的坑两种修改时区的方法:本地

conda安装GPU版pytorch默认却是cpu版本

《conda安装GPU版pytorch默认却是cpu版本》本文主要介绍了遇到Conda安装PyTorchGPU版本却默认安装CPU的问题,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的... 目录一、问题描述二、网上解决方案罗列【此节为反面方案罗列!!!】三、发现的根本原因[独家]3.1 p

Redis指南及6.2.x版本安装过程

《Redis指南及6.2.x版本安装过程》Redis是完全开源免费的,遵守BSD协议,是一个高性能(NOSQL)的key-value数据库,Redis是一个开源的使用ANSIC语言编写、支持网络、... 目录概述Redis特点Redis应用场景缓存缓存分布式会话分布式锁社交网络最新列表Redis各版本介绍旧

IIS 7.0 及更高版本中的 FTP 状态代码

《IIS7.0及更高版本中的FTP状态代码》本文介绍IIS7.0中的FTP状态代码,方便大家在使用iis中发现ftp的问题... 简介尝试使用 FTP 访问运行 Internet Information Services (IIS) 7.0 或更高版本的服务器上的内容时,IIS 将返回指示响应状态的数字代

Android NDK版本迭代与FFmpeg交叉编译完全指南

《AndroidNDK版本迭代与FFmpeg交叉编译完全指南》在Android开发中,使用NDK进行原生代码开发是一项常见需求,特别是当我们需要集成FFmpeg这样的多媒体处理库时,本文将深入分析A... 目录一、android NDK版本迭代分界线二、FFmpeg交叉编译关键注意事项三、完整编译脚本示例四

查看MySQL数据库版本的四种方法

《查看MySQL数据库版本的四种方法》查看MySQL数据库的版本信息可以通过多种方法实现,包括使用命令行工具、SQL查询语句和图形化管理工具等,以下是详细的步骤和示例代码,需要的朋友可以参考下... 目录方法一:使用命令行工具1. 使用 mysql 命令示例:方法二:使用 mysqladmin 命令示例:方

Java版本不兼容问题详细解决方案步骤

《Java版本不兼容问题详细解决方案步骤》:本文主要介绍Java版本不兼容问题解决的相关资料,详细分析了问题原因,并提供了解决方案,包括统一JDK版本、修改项目配置和清理旧版本残留等步骤,需要的朋... 目录错误原因分析解决方案步骤第一步:统一 JDK 版本第二步:修改项目配置第三步:清理旧版本残留兼容性对

Linux搭建单机MySQL8.0.26版本的操作方法

《Linux搭建单机MySQL8.0.26版本的操作方法》:本文主要介绍Linux搭建单机MySQL8.0.26版本的操作方法,本文通过图文并茂的形式给大家讲解的非常详细,感兴趣的朋友一起看看吧... 目录概述环境信息数据库服务安装步骤下载前置依赖服务下载方式一:进入官网下载,并上传到宿主机中,适合离线环境

浅谈配置MMCV环境,解决报错,版本不匹配问题

《浅谈配置MMCV环境,解决报错,版本不匹配问题》:本文主要介绍浅谈配置MMCV环境,解决报错,版本不匹配问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录配置MMCV环境,解决报错,版本不匹配错误示例正确示例总结配置MMCV环境,解决报错,版本不匹配在col