StabilityAI公司发布新模型StableLM Zephyr 3B 使人工智能的稳定性变得“讨人喜”

本文主要是介绍StabilityAI公司发布新模型StableLM Zephyr 3B 使人工智能的稳定性变得“讨人喜”,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Stability AI 最为人所知的是其稳定的扩散文本到图像生成 AI 模型套件,但这并不是该公司的全部。Stability AI 发布了最新的模型 ——StableLM Zephyr 3B,这是一个 30 亿参数的大型语言模型(LLM),用于聊天使用案例,包括文本生成、摘要和内容个性化。这个新模型是 StableLM 文本生成模型的一个更小、优化的版本,Stability AI 在 4 月份首次开始讨论该模型。

StableLM Zephyr 3B 的承诺是,它比 70 亿的 StableLM 模型更小,从而提供了一系列的好处。尺寸更小使其能够在更广泛的硬件上部署,资源占用更低,同时仍能提供快速响应。该模型经过了问答和指导类型任务的优化。

Stability AI 的首席执行官 Emad Mostaque 表示:“StableLM 经过了比之前的模型更长时间、质量更好的数据训练,例如,与 LLaMA v2 7b 相比,代币数量是后者的两倍,尽管体积只有后者的 40%,但在基本性能上仍然可以匹配。”。

StableLM Zephyr 3B 并不是一个全新的模型,而是 Stability AI 定义的现有 StableLM 3B-4e1t 模型的扩展。Zephyr 采用了一种由 HuggingFace 的 Zephyr 7B 模型启发的设计方法。HuggingFace 的 Zephyr 模型是在开源的 MIT 许可下开发的,旨在充当助手。Zephyr 使用了一种称为直接偏好优化(DPO)的训练方法,StableLM 现在也从中受益。

Mostaque 解释说,直接偏好优化(DPO)是一种替代性方法,用于调整之前的模型以适应人类的偏好。DPO 通常用于更大的 70 亿参数模型,而 StableLM Zephyr 是其中使用该技术的较小的 30 亿参数模型之一。

Stability AI 使用了 OpenBMB 研究小组的 UltraFeedback 数据集进行了 DPO 训练。UltraFeedback 数据集中有超过 64,000 个提示和 256,000 个响应。DPO、较小的模型尺寸和优化的数据训练集的结合使得 StableLM 在 Stability AI 提供的指标中表现出色。例如,在 MT Bench 评估中,StableLM Zephyr 3B 能够胜过 Meta 的 Llama-2-70b-chat 和 Anthropric 的 Claude-V1 等更大的模型。

StableLM Zephyr 3B 是 Stability AI 近几个月发布的一系列新模型中的一员,作为这家生成式 AI 初创公司不断推进其能力和工具的进展。

虽然 Stability AI 一直忙于扩展到不同的领域,但新模型并没有意味着该公司忽视了文本到图像生成的基础。上周,Stability AI 发布了 SDXL Turbo,作为其旗舰 SDXL 文本到图像稳定扩散模型的更快版本。

Mostaque 还明确表示,Stability AI 还有更多创新成果即将推出。“我们相信,小型、开放、高性能的模型,根据用户自己的数据进行调整,将胜过更大的通用模型。” 莫斯塔克说。“随着我们新的 StableLM 模型的全面发布,我们期待进一步推动生成式语言模型的民主化。”

这篇关于StabilityAI公司发布新模型StableLM Zephyr 3B 使人工智能的稳定性变得“讨人喜”的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/485347

相关文章

详解如何使用Python从零开始构建文本统计模型

《详解如何使用Python从零开始构建文本统计模型》在自然语言处理领域,词汇表构建是文本预处理的关键环节,本文通过Python代码实践,演示如何从原始文本中提取多尺度特征,并通过动态调整机制构建更精确... 目录一、项目背景与核心思想二、核心代码解析1. 数据加载与预处理2. 多尺度字符统计3. 统计结果可

SpringBoot整合Sa-Token实现RBAC权限模型的过程解析

《SpringBoot整合Sa-Token实现RBAC权限模型的过程解析》:本文主要介绍SpringBoot整合Sa-Token实现RBAC权限模型的过程解析,本文给大家介绍的非常详细,对大家的学... 目录前言一、基础概念1.1 RBAC模型核心概念1.2 Sa-Token核心功能1.3 环境准备二、表结

macOS Sequoia 15.5 发布: 改进邮件和屏幕使用时间功能

《macOSSequoia15.5发布:改进邮件和屏幕使用时间功能》经过常规Beta测试后,新的macOSSequoia15.5现已公开发布,但重要的新功能将被保留到WWDC和... MACOS Sequoia 15.5 正式发布!本次更新为 Mac 用户带来了一系列功能强化、错误修复和安全性提升,进一步增

Maven 依赖发布与仓库治理的过程解析

《Maven依赖发布与仓库治理的过程解析》:本文主要介绍Maven依赖发布与仓库治理的过程解析,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下... 目录Maven 依赖发布与仓库治理引言第一章:distributionManagement配置的工程化实践1

使用Python构建一个Hexo博客发布工具

《使用Python构建一个Hexo博客发布工具》虽然Hexo的命令行工具非常强大,但对于日常的博客撰写和发布过程,我总觉得缺少一个直观的图形界面来简化操作,下面我们就来看看如何使用Python构建一个... 目录引言Hexo博客系统简介设计需求技术选择代码实现主框架界面设计核心功能实现1. 发布文章2. 加

售价599元起! 华为路由器X1/Pro发布 配置与区别一览

《售价599元起!华为路由器X1/Pro发布配置与区别一览》华为路由器X1/Pro发布,有朋友留言问华为路由X1和X1Pro怎么选择,关于这个问题,本期图文将对这二款路由器做了期参数对比,大家看... 华为路由 X1 系列已经正式发布并开启预售,将在 4 月 25 日 10:08 正式开售,两款产品分别为华

利用Python快速搭建Markdown笔记发布系统

《利用Python快速搭建Markdown笔记发布系统》这篇文章主要为大家详细介绍了使用Python生态的成熟工具,在30分钟内搭建一个支持Markdown渲染、分类标签、全文搜索的私有化知识发布系统... 目录引言:为什么要自建知识博客一、技术选型:极简主义开发栈二、系统架构设计三、核心代码实现(分步解析

Spring Security基于数据库的ABAC属性权限模型实战开发教程

《SpringSecurity基于数据库的ABAC属性权限模型实战开发教程》:本文主要介绍SpringSecurity基于数据库的ABAC属性权限模型实战开发教程,本文给大家介绍的非常详细,对大... 目录1. 前言2. 权限决策依据RBACABAC综合对比3. 数据库表结构说明4. 实战开始5. MyBA

微信公众号脚本-获取热搜自动新建草稿并发布文章

《微信公众号脚本-获取热搜自动新建草稿并发布文章》本来想写一个自动化发布微信公众号的小绿书的脚本,但是微信公众号官网没有小绿书的接口,那就写一个获取热搜微信普通文章的脚本吧,:本文主要介绍微信公众... 目录介绍思路前期准备环境要求获取接口token获取热搜获取热搜数据下载热搜图片给图片加上标题文字上传图片

SpringKafka消息发布之KafkaTemplate与事务支持功能

《SpringKafka消息发布之KafkaTemplate与事务支持功能》通过本文介绍的基本用法、序列化选项、事务支持、错误处理和性能优化技术,开发者可以构建高效可靠的Kafka消息发布系统,事务支... 目录引言一、KafkaTemplate基础二、消息序列化三、事务支持机制四、错误处理与重试五、性能优