微软正在自主构建一个名为 MAI-1 的大型语言模型(不依赖 OpenAI)

2024-05-08 06:44

本文主要是介绍微软正在自主构建一个名为 MAI-1 的大型语言模型(不依赖 OpenAI),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

据《The Information》报道,微软正致力于打造一个新的大规模 AI 语言模型,名为 MAI-1,有望与谷歌、Anthropic 和 OpenAI 等公司的最先进模型一较高下。这是微软自投资 OpenAI 10 亿美元获取其 AI 模型使用权以来首次自主开发如此规模的 AI 模型。OpenAI 的 GPT-4 不仅为 ChatGPT 提供动力,还驱动了微软的 Copilot 功能。

DeepMind 联合创始人 Mustafa Suleyman 将领导微软的新消费者 AI 部门。

该项目由前 Google AI 高层、曾担任 AI 创企 Inflection 首席执行官的 Mustafa Suleyman 负责。微软于 3 月以 6.5 亿美元的价格收购了该初创公司的大部分员工和知识产权。虽然 MAI-1 或许借鉴了 Inflection 团队带来的技术,但据两位了解项目的微软员工表示,MAI-1 是全新的大型语言模型(LLM)。

拥有大约 5000 亿参数的 MAI-1,将比微软以往的开源模型(如上个月报道的 Phi-3)规模更大,因而需要更多计算能力和训练数据。据报道,MAI-1 与传闻中拥有超过 1 万亿参数的 OpenAI GPT-4 规模相近,并远超 Meta 和 Mistral 的 700 亿参数模型。

MAI-1 的开发体现了微软对 AI 双管齐下的策略,一方面专注于适用于移动设备的小型本地语言模型,另一方面开发由云端驱动的大型最先进模型。苹果据称也在探索类似的策略。这也凸显出微软愿意独立于 OpenAI 进行 AI 开发,目前微软最雄心勃勃的生成式 AI 功能由 OpenAI 技术驱动,包括嵌入 Windows 的聊天机器人。

苹果发布了 8 款针对设备端使用的小型 AI 语言模型。

据消息人士透露,MAI-1 的具体用途尚未确定,其最佳应用将取决于模型的性能。为训练该模型,微软已经部署了一大批 Nvidia GPU 服务器,并从多种来源收集训练数据,包括 OpenAI GPT-4 生成的文本和公共互联网数据。

根据《The Information》援引的消息人士称,视项目进展情况,微软或许最早会在本月的 Build 开发者大会上展示 MAI-1。

这篇关于微软正在自主构建一个名为 MAI-1 的大型语言模型(不依赖 OpenAI)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/969602

相关文章

gradle第三方Jar包依赖统一管理方式

《gradle第三方Jar包依赖统一管理方式》:本文主要介绍gradle第三方Jar包依赖统一管理方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录背景实现1.顶层模块build.gradle添加依赖管理插件2.顶层模块build.gradle添加所有管理依赖包

Java中的StringBuilder之如何高效构建字符串

《Java中的StringBuilder之如何高效构建字符串》本文将深入浅出地介绍StringBuilder的使用方法、性能优势以及相关字符串处理技术,结合代码示例帮助读者更好地理解和应用,希望对大家... 目录关键点什么是 StringBuilder?为什么需要 StringBuilder?如何使用 St

Maven中引入 springboot 相关依赖的方式(最新推荐)

《Maven中引入springboot相关依赖的方式(最新推荐)》:本文主要介绍Maven中引入springboot相关依赖的方式(最新推荐),本文给大家介绍的非常详细,对大家的学习或工作具有... 目录Maven中引入 springboot 相关依赖的方式1. 不使用版本管理(不推荐)2、使用版本管理(推

C语言中位操作的实际应用举例

《C语言中位操作的实际应用举例》:本文主要介绍C语言中位操作的实际应用,总结了位操作的使用场景,并指出了需要注意的问题,如可读性、平台依赖性和溢出风险,文中通过代码介绍的非常详细,需要的朋友可以参... 目录1. 嵌入式系统与硬件寄存器操作2. 网络协议解析3. 图像处理与颜色编码4. 高效处理布尔标志集合

Go语言开发实现查询IP信息的MCP服务器

《Go语言开发实现查询IP信息的MCP服务器》随着MCP的快速普及和广泛应用,MCP服务器也层出不穷,本文将详细介绍如何在Go语言中使用go-mcp库来开发一个查询IP信息的MCP... 目录前言mcp-ip-geo 服务器目录结构说明查询 IP 信息功能实现工具实现工具管理查询单个 IP 信息工具的实现服

C 语言中enum枚举的定义和使用小结

《C语言中enum枚举的定义和使用小结》在C语言里,enum(枚举)是一种用户自定义的数据类型,它能够让你创建一组具名的整数常量,下面我会从定义、使用、特性等方面详细介绍enum,感兴趣的朋友一起看... 目录1、引言2、基本定义3、定义枚举变量4、自定义枚举常量的值5、枚举与switch语句结合使用6、枚

Maven如何手动安装依赖到本地仓库

《Maven如何手动安装依赖到本地仓库》:本文主要介绍Maven如何手动安装依赖到本地仓库问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、下载依赖二、安装 JAR 文件到本地仓库三、验证安装四、在项目中使用该依赖1、注意事项2、额外提示总结一、下载依赖登

Spring Boot循环依赖原理、解决方案与最佳实践(全解析)

《SpringBoot循环依赖原理、解决方案与最佳实践(全解析)》循环依赖指两个或多个Bean相互直接或间接引用,形成闭环依赖关系,:本文主要介绍SpringBoot循环依赖原理、解决方案与最... 目录一、循环依赖的本质与危害1.1 什么是循环依赖?1.2 核心危害二、Spring的三级缓存机制2.1 三

使用Python构建一个Hexo博客发布工具

《使用Python构建一个Hexo博客发布工具》虽然Hexo的命令行工具非常强大,但对于日常的博客撰写和发布过程,我总觉得缺少一个直观的图形界面来简化操作,下面我们就来看看如何使用Python构建一个... 目录引言Hexo博客系统简介设计需求技术选择代码实现主框架界面设计核心功能实现1. 发布文章2. 加

Python如何自动生成环境依赖包requirements

《Python如何自动生成环境依赖包requirements》:本文主要介绍Python如何自动生成环境依赖包requirements问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑... 目录生成当前 python 环境 安装的所有依赖包1、命令2、常见问题只生成当前 项目 的所有依赖包1、