马斯克开源Grok-1:3140亿参数是GPT3.5的2倍【附保存通道】

2024-03-26 12:59

本文主要是介绍马斯克开源Grok-1:3140亿参数是GPT3.5的2倍【附保存通道】,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

普通人:财富机会来了。马斯克将3410亿参数AI语言模型开源,这是目前世界上最大的开源模型,权重架构全开放,截至目前可用于商用。

6个月内成功研发出了拥有3410亿参数的大型自研模型,马斯克实现了他的承诺!据智东西3月18日的报道,马斯克旗下的AI创企xAI正式发布了备受期待的大型模型Grok-1,其参数量高达3140亿,远超过OpenAI GPT-3.5的1750亿。

这是目前参数规模最大的开源自然语言模型,遵循Apache 2.0协议,开放模型权重和架构供人使用。这一举措将对自然语言处理领域产生深远影响。
 

Grok-1是一个采用混合专家(Mixture-of-Experts,MOE)架构的大型模型。MOE架构的关键在于提高大型模型的训练和推理效率。可以形象地理解,MOE就像将各个领域的“专家”汇集在一起,根据任务将其分配给不同领域的专家,最后综合他们的结论以提升效率。这种架构决定每个专家的任务分配,使用了被称为“门控网络”机制。xAI已经在GitHub上开源了Grok-1的权重和架构,这将有助于推动自然语言处理领域的研究和发展。

目前Grok-1的源权重数据大小大约为300GB。截至北京时间3月22日上午7时许,Grok-1项目收获了39.9千颗星。

Grok-1是马斯克旗下xAI自2023年7月12日成立以来发布的首个自研大型模型。xAI强调这是他们从头开始训练的大模型,并没有针对特定应用进行微调。xAI作为马斯克去年成立的明星AI创企之一,旨在与OpenAI、谷歌、微软等竞争对手在大型模型领域展开竞争。xAI的团队来自各大知名企业和研究机构,如OpenAI、谷歌DeepMind、谷歌研究院、微软研究院等。在公布更多关于Grok-1的细节时,xAI指出基础模型是基于大量文本数据训练的,未针对特定任务进行微调。Grok-1是一个拥有3140亿参数的Mixture-of-Experts模型,其中每个token的活跃权重比例为25%。xAI从2023年10月开始使用自定义训练堆栈在JAX和Rust之上从头训练Grok-1。尽管xAI并没有公布Grok-1的具体测试成绩,但与OpenAI即将发布的GPT-5的大型模型的竞争将成为业内关注焦点。同时,马斯克和ChatGPT官方账号之间的互动也引起了关注,展示了在AI领域的竞争与幽默之间的趣味交流。

马斯克当然不会示弱,立即反问请告诉我OpenAI在哪些方面表现得“开放”?而马斯克高仿号也随即跳出来加入讨论,指出大家都知道是Sam在运营ChatGPT的账号。此次xAI发布Grok-1消息时所使用的封面图片是由Midjourney生成的。Grok-1给出了一个提示文本:一个神经网络的3D插图,展示具有透明节点和发光连接的神经网络,显示不同粗细和颜色的连接线代表不同权重。

获取保存通道👇👇👇

公众号:「吉吉说安全」,对我发消息【20240322】获取Grok-1保存通道

免费红队知识库:

会持续给大家更新更好东西,期待得到你随手免费的

【点赞】【在看】【转发】

今年肯定能“一帆风顺,二龙腾飞,三羊开泰,四季平安,五福临门,六六大顺,七星高照,八方来财,九九同心,十全十美,百事亨通,千事吉祥,万事如意“。

免责声明

由于传播、利用本公众号所提供的信息而造成的任何直接或者间接的后果及损失,均由使用者本人负责,本公众号及作者不为此承担任何责任,一旦造成后果请自行承担!如有侵权烦请告知,我们会立即删除并致歉。谢谢!

这篇关于马斯克开源Grok-1:3140亿参数是GPT3.5的2倍【附保存通道】的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/848590

相关文章

Java使用HttpClient实现图片下载与本地保存功能

《Java使用HttpClient实现图片下载与本地保存功能》在当今数字化时代,网络资源的获取与处理已成为软件开发中的常见需求,其中,图片作为网络上最常见的资源之一,其下载与保存功能在许多应用场景中都... 目录引言一、Apache HttpClient简介二、技术栈与环境准备三、实现图片下载与保存功能1.

一文详解PostgreSQL复制参数

《一文详解PostgreSQL复制参数》PostgreSQL作为一款功能强大的开源关系型数据库,其复制功能对于构建高可用性系统至关重要,本文给大家详细介绍了PostgreSQL的复制参数,需要的朋友可... 目录一、复制参数基础概念二、核心复制参数深度解析1. max_wal_seChina编程nders:WAL

Linux高并发场景下的网络参数调优实战指南

《Linux高并发场景下的网络参数调优实战指南》在高并发网络服务场景中,Linux内核的默认网络参数往往无法满足需求,导致性能瓶颈、连接超时甚至服务崩溃,本文基于真实案例分析,从参数解读、问题诊断到优... 目录一、问题背景:当并发连接遇上性能瓶颈1.1 案例环境1.2 初始参数分析二、深度诊断:连接状态与

史上最全nginx详细参数配置

《史上最全nginx详细参数配置》Nginx是一个轻量级高性能的HTTP和反向代理服务器,同时也是一个通用代理服务器(TCP/UDP/IMAP/POP3/SMTP),最初由俄罗斯人IgorSyso... 目录基本命令默认配置搭建站点根据文件类型设置过期时间禁止文件缓存防盗链静态文件压缩指定定错误页面跨域问题

SpringBoot请求参数接收控制指南分享

《SpringBoot请求参数接收控制指南分享》:本文主要介绍SpringBoot请求参数接收控制指南,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Spring Boot 请求参数接收控制指南1. 概述2. 有注解时参数接收方式对比3. 无注解时接收参数默认位置

Python使用getopt处理命令行参数示例解析(最佳实践)

《Python使用getopt处理命令行参数示例解析(最佳实践)》getopt模块是Python标准库中一个简单但强大的命令行参数处理工具,它特别适合那些需要快速实现基本命令行参数解析的场景,或者需要... 目录为什么需要处理命令行参数?getopt模块基础实际应用示例与其他参数处理方式的比较常见问http

Linux内核参数配置与验证详细指南

《Linux内核参数配置与验证详细指南》在Linux系统运维和性能优化中,内核参数(sysctl)的配置至关重要,本文主要来聊聊如何配置与验证这些Linux内核参数,希望对大家有一定的帮助... 目录1. 引言2. 内核参数的作用3. 如何设置内核参数3.1 临时设置(重启失效)3.2 永久设置(重启仍生效

SpringMVC获取请求参数的方法

《SpringMVC获取请求参数的方法》:本文主要介绍SpringMVC获取请求参数的方法,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下... 目录1、通过ServletAPI获取2、通过控制器方法的形参获取请求参数3、@RequestParam4、@

Spring Boot项目部署命令java -jar的各种参数及作用详解

《SpringBoot项目部署命令java-jar的各种参数及作用详解》:本文主要介绍SpringBoot项目部署命令java-jar的各种参数及作用的相关资料,包括设置内存大小、垃圾回收... 目录前言一、基础命令结构二、常见的 Java 命令参数1. 设置内存大小2. 配置垃圾回收器3. 配置线程栈大小

SpringBoot利用@Validated注解优雅实现参数校验

《SpringBoot利用@Validated注解优雅实现参数校验》在开发Web应用时,用户输入的合法性校验是保障系统稳定性的基础,​SpringBoot的@Validated注解提供了一种更优雅的解... 目录​一、为什么需要参数校验二、Validated 的核心用法​1. 基础校验2. php分组校验3