Llama3 端侧部署:算丰 SG2300x 与爱芯元智 AX650N

2024-04-30 04:20

本文主要是介绍Llama3 端侧部署:算丰 SG2300x 与爱芯元智 AX650N,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

美国当地时间4月18日,Meta 开源了 Llama3 大模型,包括一个 8B 模型和一个 70B 模型在测试基准中,Llama 3 模型的表现相当出色,在实用性和安全性评估中,与那些市面上流行的闭源模型不相上下。

Llama3 性能指标:

相对于 LLama2,Llama3 的性能有了很大的提高:

Meta 表示,Llama 3 在多个关键基准测试中展现出卓越性能,超越了业内先进的同类模型。无论是在代码生成、复杂推理,还是在遵循指令和可视化想法方面,Llama 3 都实现了全面领先。该模型在以下五个基准测试中均表现出色:

  • MMLU(学科知识理解)

  • GPQA(一般问题解答)

  • HumanEval(代码能力)

  • GSM-8K(数学能力)

  • MATH(高难度数学问题)

根据 Meta 的测试结果,Llama 3 8B 模型在 MMLU、GPQA、HumanEval 等多项性能基准上均超过了 Gemma 7B 和 Mistral 7B Instruct,70B 模型则超越了名声在外的闭源模型 Claude 3 的中间版本 Sonnet,和谷歌的 Gemini Pro 1.5 相比三胜两负。 

算丰 SG2300x:

4月20日,瑞莎宣称:面对 Llama 3 如此激动人心的性能,Airbox 团队积极响应,快速将 Llama3 8B 移植并成功在 Airbox 上运行。

并推出 SOPHON SG2300X SoC 处理器的 Radxa Fogwise AirBox,来作端侧部署:

Radxa Fogwise AirBox
形态尺寸

104mm x 84mm x 52mm

处理器SOPHON SG2300X SoC,八核 Arm® Cortex®-A53(ARMv8)@ 2.3GHz
TPU张量处理单元,计算能力:最高达24TOPS(INT8),12TFLOPS(FP16/BF16)和2TFLOPS(FP32)
支持领先的深度学习框架,包括 TensorFlow、Caffe、PyTorch、Paddle、ONNX、MXNet、Tengine 和 DarkNet
内存16GB LPDDR4X

存储

工业级 64GB eMMC
16MB SPI 闪存
提供高速SD卡的SD卡插槽

多媒体

支持解码32路H.265/H.264 1080p@25fps视频
完全处理32路高清1080P@25fps视频,涉及解码和AI分析
支持编码12路H.265/H.264 1080p@25fps视频
JPEG:1080P@600fps,支持最大32768 x 32768
支持视频后处理,包括图像CSC、调整大小、裁剪、填充、边框、字体、对比度和亮度调整。
连接2x 千兆以太网端口(RJ45)
1x M.2 M Key(2230/2242)用于NVMe SSD
1x M.2 E Key用于WI-FI/BT
工作温度0°C 到 45°C
外壳耐腐蚀的铝合金外壳
散热器PWM调速风扇与定制散热片

 并以视频展示了 Llama3 8B 在 Airbox 上的运行情况:

可以看见,Llama 3 8B 在 Airbox 上的运行表现极为流畅,达到了 9.6 token/s 的处理速度。 

爱芯元智 AX650N:

4月28日,AI 芯片公司爱芯元智宣布,公司 NPU 工具链团队已基于 AX650N 平台完成适配 Meta 发布的 Llama 3 8B 和 Microsoft 发布的 Phi-3-mini 模型。另外,爱芯元智已经完成了 Llama 2、TinyLlama、Phi-2、Qwen1.5、ChatGLM3等国内外主流的开源大语言模型适配,推动 AI 大模型技术应用普及。

AX650N 是一款兼具高算力、高能效比和超强编解码性的 SoC 芯片,集成了八核 A55 CPU,72.0TOPs@INT4 或 18.0TOPs@INT8 高算力的 NPU,支持 8K 30fps 的 ISP,以及 H.264、H.265 编解码的 VPU。

随后我们估计可以在 AX-LLM 项目里找到相关的代码。

该项目由 爱芯元智 主导开发,用于探索业界常用 LLM(Large Language Model) 在已有芯片平台上落地的可行性和相关能力边界,方便社区开发者进行快速评估和二次开发自己的 LLM 应用。

目前支持:AX650A/AX650N 芯片。已支持模型:TinyLLaMa-1.1B 和 Qwen1.5-1.8B。

小结:

随着国内外大模型的飞速发展,大模型的性能和效果越来越好;国内 AI 芯片的处理能力也已经足够优秀,端侧部署也可以达到良好的体验,想必会有越来越多的硬件厂商陆续跟进。

我们拭目以待。

                                                                                         老徐,2024/4/29

这篇关于Llama3 端侧部署:算丰 SG2300x 与爱芯元智 AX650N的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/947894

相关文章

Web技术与Nginx网站环境部署教程

《Web技术与Nginx网站环境部署教程》:本文主要介绍Web技术与Nginx网站环境部署教程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、Web基础1.域名系统DNS2.Hosts文件3.DNS4.域名注册二.网页与html1.网页概述2.HTML概述3.

Nginx使用Keepalived部署web集群(高可用高性能负载均衡)实战案例

《Nginx使用Keepalived部署web集群(高可用高性能负载均衡)实战案例》本文介绍Nginx+Keepalived实现Web集群高可用负载均衡的部署与测试,涵盖架构设计、环境配置、健康检查、... 目录前言一、架构设计二、环境准备三、案例部署配置 前端 Keepalived配置 前端 Nginx

ubuntu如何部署Dify以及安装Docker? Dify安装部署指南

《ubuntu如何部署Dify以及安装Docker?Dify安装部署指南》Dify是一个开源的大模型应用开发平台,允许用户快速构建和部署基于大语言模型的应用,ubuntu如何部署Dify呢?详细请... Dify是个不错的开源LLM应用开发平台,提供从 Agent 构建到 AI workflow 编排、RA

ubuntu16.04如何部署dify? 在Linux上安装部署Dify的技巧

《ubuntu16.04如何部署dify?在Linux上安装部署Dify的技巧》随着云计算和容器技术的快速发展,Docker已经成为现代软件开发和部署的重要工具之一,Dify作为一款优秀的云原生应用... Dify 是一个基于 docker 的工作流管理工具,旨在简化机器学习和数据科学领域的多步骤工作流。它

Nginx部署React项目时重定向循环问题的解决方案

《Nginx部署React项目时重定向循环问题的解决方案》Nginx在处理React项目请求时出现重定向循环,通常是由于`try_files`配置错误或`root`路径配置不当导致的,本文给大家详细介... 目录问题原因1. try_files 配置错误2. root 路径错误解决方法1. 检查 try_f

Spring Boot项目部署命令java -jar的各种参数及作用详解

《SpringBoot项目部署命令java-jar的各种参数及作用详解》:本文主要介绍SpringBoot项目部署命令java-jar的各种参数及作用的相关资料,包括设置内存大小、垃圾回收... 目录前言一、基础命令结构二、常见的 Java 命令参数1. 设置内存大小2. 配置垃圾回收器3. 配置线程栈大小

tomcat多实例部署的项目实践

《tomcat多实例部署的项目实践》Tomcat多实例是指在一台设备上运行多个Tomcat服务,这些Tomcat相互独立,本文主要介绍了tomcat多实例部署的项目实践,具有一定的参考价值,感兴趣的可... 目录1.创建项目目录,测试文China编程件2js.创建实例的安装目录3.准备实例的配置文件4.编辑实例的

SpringBoot配置Ollama实现本地部署DeepSeek

《SpringBoot配置Ollama实现本地部署DeepSeek》本文主要介绍了在本地环境中使用Ollama配置DeepSeek模型,并在IntelliJIDEA中创建一个Sprin... 目录前言详细步骤一、本地配置DeepSeek二、SpringBoot项目调用本地DeepSeek前言随着人工智能技

通过Docker Compose部署MySQL的详细教程

《通过DockerCompose部署MySQL的详细教程》DockerCompose作为Docker官方的容器编排工具,为MySQL数据库部署带来了显著优势,下面小编就来为大家详细介绍一... 目录一、docker Compose 部署 mysql 的优势二、环境准备与基础配置2.1 项目目录结构2.2 基

CentOS 7部署主域名服务器 DNS的方法

《CentOS7部署主域名服务器DNS的方法》文章详细介绍了在CentOS7上部署主域名服务器DNS的步骤,包括安装BIND服务、配置DNS服务、添加域名区域、创建区域文件、配置反向解析、检查配置... 目录1. 安装 BIND 服务和工具2.  配置 BIND 服务3 . 添加你的域名区域配置4.创建区域