4B参数秒杀GPT-3.5:MiniCPM 3.0惊艳登场!

2024-09-09 16:52

本文主要是介绍4B参数秒杀GPT-3.5:MiniCPM 3.0惊艳登场!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

image.png

面壁智能

在 AI 的世界里,总有那么几个时刻让人惊叹不已。面壁智能推出的 MiniCPM 3.0,这个仅有4B参数的"小钢炮",正在以惊人的实力挑战着 GPT-3.5 这个曾经的AI巨人。

MiniCPM 3.0

image.png

MiniCPM 3.0

MiniCPM 3.0 目前的主要功能有:

长上下文功能:原生支持 32k 上下文长度,性能完美。我们引入了 LLM x MapReduce 方法,理论上可以处理长达无穷大的上下文长度。

出色的中英文教学跟随能力:超过 GLM-4-9B-Chat 和 Qwen2-7B-Instruct 的英语教学遵循 IFEval 和中文教学跟随 FollowBench-zh。

卓越的推理能力: 在数学能力方面,它优于 GPT-3.5-Turbo 和 MathBench 上的几个 7B-9B 模型。在极具挑战性的 LiveCodeBench 上,它超越了 Llama3.1-8B-Instruct。

支持函数调用🛠️和代码解释器:在伯克利函数调用排行榜 (BFCL) 上参数少于 9B 的模型中实现了 SOTA,性能优于 GLM-4-9B-Chat 和 Qwen2-7B-Instruct。

RAG 功能:我们发布了 MiniCPM RAG Suite。MiniCPM-Embedding 和 MiniCPM-Reranker 基于 MiniCPM 系列模型,在中英跨语言检索测试中实现了 SOTA 性能。MiniCPM3-RAG-LoRA 专为 RAG 场景设计,在开放域问答等多项任务上优于 Llama3-8B 和百川 2-13B 等模型。

性能对比

image.png

各项参数对比

MiniCPM 3.0 尽管只有4B的参数大小,但测试数据表示它的能力可不一般。

image.png

各项参数对比

这个"小不点"不仅在多项能力上超越了 GPT-3.5,还在某些方面胜过了Qwen2-7B、Phi-3.5、GLM4-9B 和 LLaMa3-8B 等"大块头"。而且从平均的水平来看更是力压群雄,超过了所有对比的模型。

image.png

各项参数对比

在上下文长度为 32k 的 Needle in a Haystack 测试中,MiniCPM 3.0 展现出了超越 GPT-4 和 KimiChat 等顶级模型的长文本处理能力。它就像是一个永不疲倦的阅读者,无论文本多长,都能保持高效准确的理解和处理。

 有关厚德云

厚德云致力于为用户提供稳定、可靠、易用、省钱的 GPU 算力解决方案。海量 GPU 算力资源租用,就在厚德云。

这篇关于4B参数秒杀GPT-3.5:MiniCPM 3.0惊艳登场!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1151731

相关文章

SpringBoot 获取请求参数的常用注解及用法

《SpringBoot获取请求参数的常用注解及用法》SpringBoot通过@RequestParam、@PathVariable等注解支持从HTTP请求中获取参数,涵盖查询、路径、请求体、头、C... 目录SpringBoot 提供了多种注解来方便地从 HTTP 请求中获取参数以下是主要的注解及其用法:1

HTTP 与 SpringBoot 参数提交与接收协议方式

《HTTP与SpringBoot参数提交与接收协议方式》HTTP参数提交方式包括URL查询、表单、JSON/XML、路径变量、头部、Cookie、GraphQL、WebSocket和SSE,依据... 目录HTTP 协议支持多种参数提交方式,主要取决于请求方法(Method)和内容类型(Content-Ty

python中的显式声明类型参数使用方式

《python中的显式声明类型参数使用方式》文章探讨了Python3.10+版本中类型注解的使用,指出FastAPI官方示例强调显式声明参数类型,通过|操作符替代Union/Optional,可提升代... 目录背景python函数显式声明的类型汇总基本类型集合类型Optional and Union(py

Go语言使用Gin处理路由参数和查询参数

《Go语言使用Gin处理路由参数和查询参数》在WebAPI开发中,处理路由参数(PathParameter)和查询参数(QueryParameter)是非常常见的需求,下面我们就来看看Go语言... 目录一、路由参数 vs 查询参数二、Gin 获取路由参数和查询参数三、示例代码四、运行与测试1. 测试编程路

Mybatis-Plus 3.5.12 分页拦截器消失的问题及快速解决方法

《Mybatis-Plus3.5.12分页拦截器消失的问题及快速解决方法》作为Java开发者,我们都爱用Mybatis-Plus简化CRUD操作,尤其是它的分页功能,几行代码就能搞定复杂的分页查询... 目录一、问题场景:分页拦截器突然 “失踪”二、问题根源:依赖拆分惹的祸三、解决办法:添加扩展依赖四、分页

Python lambda函数(匿名函数)、参数类型与递归全解析

《Pythonlambda函数(匿名函数)、参数类型与递归全解析》本文详解Python中lambda匿名函数、灵活参数类型和递归函数三大进阶特性,分别介绍其定义、应用场景及注意事项,助力编写简洁高效... 目录一、lambda 匿名函数:简洁的单行函数1. lambda 的定义与基本用法2. lambda

Spring Boot spring-boot-maven-plugin 参数配置详解(最新推荐)

《SpringBootspring-boot-maven-plugin参数配置详解(最新推荐)》文章介绍了SpringBootMaven插件的5个核心目标(repackage、run、start... 目录一 spring-boot-maven-plugin 插件的5个Goals二 应用场景1 重新打包应用

Java内存分配与JVM参数详解(推荐)

《Java内存分配与JVM参数详解(推荐)》本文详解JVM内存结构与参数调整,涵盖堆分代、元空间、GC选择及优化策略,帮助开发者提升性能、避免内存泄漏,本文给大家介绍Java内存分配与JVM参数详解,... 目录引言JVM内存结构JVM参数概述堆内存分配年轻代与老年代调整堆内存大小调整年轻代与老年代比例元空

一文详解PostgreSQL复制参数

《一文详解PostgreSQL复制参数》PostgreSQL作为一款功能强大的开源关系型数据库,其复制功能对于构建高可用性系统至关重要,本文给大家详细介绍了PostgreSQL的复制参数,需要的朋友可... 目录一、复制参数基础概念二、核心复制参数深度解析1. max_wal_seChina编程nders:WAL

Linux高并发场景下的网络参数调优实战指南

《Linux高并发场景下的网络参数调优实战指南》在高并发网络服务场景中,Linux内核的默认网络参数往往无法满足需求,导致性能瓶颈、连接超时甚至服务崩溃,本文基于真实案例分析,从参数解读、问题诊断到优... 目录一、问题背景:当并发连接遇上性能瓶颈1.1 案例环境1.2 初始参数分析二、深度诊断:连接状态与