支持处理30万中文汉字的超长文本大模型——“国产大模型五虎”之零一万物

本文主要是介绍支持处理30万中文汉字的超长文本大模型——“国产大模型五虎”之零一万物,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言:

在前面的四篇文章中,我们分别介绍了KimiChat,MiniMax,智谱AI以及百川智能四个国产大模型,他们都被称之为“国产大模型五虎”。今天来到了这个系列的最后一章:零一万物,至此,大模型五虎全部集齐。


在介绍零一万物之前,我们先来看一组数据

这是截止到今年2月份, 中文大模型基准SuperCLUE统计的关于“国内外大模型发展趋势”的数据,其中的数值代表了发展的水平,我们可以清晰的看到虽然GPT一直是处于领先地位,但是国内的大模型已经实现了代际赶超的奇迹,远超GPT3.5的水平,无限接近GPT4.0的能力。

由此可知,尽管国内大模型发展起步的晚,但是在发展规模和发展潜力上却有着显著的优势。同样的,今天我们介绍的大模型,也是起步虽晚,但目前已经在超长文本处理领域取得了领先的地位。

下面我们就来一探究竟,看看这最后“一虎”,到底有何能力受诸多资方的青睐

提到李开复,相信大家都不陌生吧,曾在微软,谷歌等企业任职,后来创立了创新工场,一直活跃在AI领域。

零一万物则是由他带领一众全球顶尖科技公司的专业人才创立的一家AI大模型创业公司,专注于AI 2.0平台和应用的研发。

零一万物最新发布的大模型是“Yi”系列,包括Yi-6B和Yi-34B两个版本,

Yi-34B是一个具有340亿参数的基础模型,而Yi-6B的参数规模为60亿

这两个模型都是中英双语开源大模型

Yi-34B在关键指标上胜过市场上已有的领先开源模型,包括Meta的Llama 2,并在Hugging Face英文开源社区平台和C-Eval中文评测的最新榜单中爬升到第一位,成为全球开源大模型“双料冠军”

Yi-34B拥有全球大模型中最长的200K上下文窗口,可以处理约40万字的文本(官网公布的数据,实际上属于是反向虚标了,值得表扬),相当于他可以阅读理解超1000页PPT,一次性读完两本《三体》

既然说到这了,那我们就来实测一下看看它超长文本处理的能力到底是不是浪得虚名

我节选了《平凡的世界》的其中部分文字约25万字(原文100W字),来测试一下它的阅读能力

一共问了5个问题,从最基本的阅读,再到理解 ,和发表自己的看法,零一万物都给出了比较满意的答案。

不亏是霸榜SuperCLUE-256k的唯一大模型

超长文本能力确实吊,那我们再试试它的其它能力

老规矩,放上一个数学题让它解一下看看

我向它提问:565547854121的平方是多少

这就尴尬了不是,后面给我打了无数个9

又试了一下角色扮演能力,中规中矩,跟其它几个大模型表现的水平差不多


简单总结一下,Yi-34B确实有自己的过人之处,被称之为AI独角兽确实当之无愧,但是在一些方面还是距ChatGPT有不小的差距。

最后附上一张当前最新的国内外大模型能力总排行榜单

这篇关于支持处理30万中文汉字的超长文本大模型——“国产大模型五虎”之零一万物的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/911194

相关文章

Python Pandas高效处理Excel数据完整指南

《PythonPandas高效处理Excel数据完整指南》在数据驱动的时代,Excel仍是大量企业存储核心数据的工具,Python的Pandas库凭借其向量化计算、内存优化和丰富的数据处理接口,成为... 目录一、环境搭建与数据读取1.1 基础环境配置1.2 数据高效载入技巧二、数据清洗核心战术2.1 缺失

SpringBoot项目中Redis存储Session对象序列化处理

《SpringBoot项目中Redis存储Session对象序列化处理》在SpringBoot项目中使用Redis存储Session时,对象的序列化和反序列化是关键步骤,下面我们就来讲讲如何在Spri... 目录一、为什么需要序列化处理二、Spring Boot 集成 Redis 存储 Session2.1

Python处理超大规模数据的4大方法详解

《Python处理超大规模数据的4大方法详解》在数据的奇妙世界里,数据量就像滚雪球一样,越变越大,从最初的GB级别的小数据堆,逐渐演变成TB级别的数据大山,所以本文我们就来看看Python处理... 目录1. Mars:数据处理界的 “变形金刚”2. Dask:分布式计算的 “指挥家”3. CuPy:GPU

Python中CSV文件处理全攻略

《Python中CSV文件处理全攻略》在数据处理和存储领域,CSV格式凭借其简单高效的特性,成为了电子表格和数据库中常用的文件格式,Python的csv模块为操作CSV文件提供了强大的支持,本文将深入... 目录一、CSV 格式简介二、csv模块核心内容(一)模块函数(二)模块类(三)模块常量(四)模块异常

详解如何在SpringBoot控制器中处理用户数据

《详解如何在SpringBoot控制器中处理用户数据》在SpringBoot应用开发中,控制器(Controller)扮演着至关重要的角色,它负责接收用户请求、处理数据并返回响应,本文将深入浅出地讲解... 目录一、获取请求参数1.1 获取查询参数1.2 获取路径参数二、处理表单提交2.1 处理表单数据三、

Spring Boot Controller处理HTTP请求体的方法

《SpringBootController处理HTTP请求体的方法》SpringBoot提供了强大的机制来处理不同Content-Type​的HTTP请求体,这主要依赖于HttpMessageCo... 目录一、核心机制:HttpMessageConverter​二、按Content-Type​处理详解1.

一文带你搞懂Redis Stream的6种消息处理模式

《一文带你搞懂RedisStream的6种消息处理模式》Redis5.0版本引入的Stream数据类型,为Redis生态带来了强大而灵活的消息队列功能,本文将为大家详细介绍RedisStream的6... 目录1. 简单消费模式(Simple Consumption)基本概念核心命令实现示例使用场景优缺点2

Java 中的 @SneakyThrows 注解使用方法(简化异常处理的利与弊)

《Java中的@SneakyThrows注解使用方法(简化异常处理的利与弊)》为了简化异常处理,Lombok提供了一个强大的注解@SneakyThrows,本文将详细介绍@SneakyThro... 目录1. @SneakyThrows 简介 1.1 什么是 Lombok?2. @SneakyThrows

在 Spring Boot 中实现异常处理最佳实践

《在SpringBoot中实现异常处理最佳实践》本文介绍如何在SpringBoot中实现异常处理,涵盖核心概念、实现方法、与先前查询的集成、性能分析、常见问题和最佳实践,感兴趣的朋友一起看看吧... 目录一、Spring Boot 异常处理的背景与核心概念1.1 为什么需要异常处理?1.2 Spring B

python处理带有时区的日期和时间数据

《python处理带有时区的日期和时间数据》这篇文章主要为大家详细介绍了如何在Python中使用pytz库处理时区信息,包括获取当前UTC时间,转换为特定时区等,有需要的小伙伴可以参考一下... 目录时区基本信息python datetime使用timezonepandas处理时区数据知识延展时区基本信息