企业数字化转型进入深海区:生成式AI时代下如何制定数据战略

本文主要是介绍企业数字化转型进入深海区:生成式AI时代下如何制定数据战略,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

云计算适用于任何人,任何企业,云计算的分支——人工智能(AI)正发展的迅疾如火,炙手可热。特别是ChatGPT已经挑战各行各业对于AI的认知。

作为全球云计算领域的年度风向标活动,12月12日,亚马逊云科技2023 re:Invent中国行落地北京。大会上,干货满满,包括亚马逊云科技数据的战略构想、如何加速构建生成式AI、芯片创新、企业级生成式AI应用等等,全球领先的云厂商亚马逊云科技对当下的AI行业进行了全方位把脉。

具体看来,在此次亚马逊云科技2023 re:Invent中国北京活动展上,围绕底层基础设施、生成式人工智能(AI)、数据战略,亚马逊云科技推出了一系列新服务及功能。包括重塑未来工作方式的新型生成式AI助手Amazon Q、Amazon Bedrock更多的模型选择和全新强大功能、Amazon SageMaker助力规模化开发应用模型的五大新功能等,帮助企业更轻松、安全地构建和应用生成式AI。为了给生成式AI提供强大的数据支持,亚马逊云科技进一步丰富向量数据库选择,推出让跨数据存储的数据访问与分析更快速、更便捷的Zero-ETL集成特性。此外,针对机器学习(ML)训练和生成式AI应用等广泛的工作负载,亚马逊云科技推出新一代自研芯片Amazon Graviton4和Amazon Trainium2。

因为数据战略是整个AI的纲,纲举才能目张。于是,我们决定将「数据战略」,作为观察今年亚马逊云科技re:Invent中国行的切入点。

 

一、生成式AI时代下的关键词:重构

亚马逊云科技re:Invent中国行大会上,亚马逊云科技高管和众多业内大咖在演讲中多次提及了两个关键词:生成式AI时代和重构。

数据已然成为新的生产要素。纵观整个云计算发展史,数据全要素生产率在PC时代是飞速增长,在互联网普及后(2005-2022)呈现增长缓慢态势,而生成式AI时代,数据全要素生产率将重新加速上升。由此,生成式AI也是人工智能从1.0时代进入2.0时代的重要标志。

随着AI相关新应用、新业态的出现,人工智能产业对算力的需求正在迎来巨量化、多元化的发展趋势, 云计算产业所需要的服务也越来越复杂、差异化、多元化。生成式AI 应运而生。

所谓生成式AI ,即企业的大数据云计算门槛被 AI 基础设施大大降低,企业可利用开箱即用的生成式 AI 服务来提升创新效率,更快地构建出实用化、多元化的应用。比如,在制造业中,生成式 AI 可以通过提取历史数据实时诊断设备故障,并建议维护操作。

眼下,生成式AI呈现席卷之势,从智能汽车、智能家居到智能穿戴,在各大领域“全面开花”,生成式AI时代正在到来。毕竟,生成式AI均是对传统微观经济学的挑战。生成式AI意味着产品的个性、定制化生产边际成本接近于0,在生成式大模型接入后,各类智能设备将迎来真正的差异化时代。

不过,生成式AI是一个系统性工程,需要一场耐力长跑,而亚马逊云科技正在勾勒出生成式AI时代长跑的路线图,并积极努力做好赢得这场耐力长跑的准备。

曾经贝索斯在2008年致亚马逊公司股东的信中所做解释大意如下:如果我们能很好了解顾客需求,并深信这种需求是有长期价值。那么,我们的一贯做法是——耐心探索,直至找到解决方案。

具体而言,生成式AI时代下如何制定数据战略?亚马逊云科技2023 re:Invent中国行给出了答案:重构。包括重构基础设施、计算,重构存储、重构企业级生成式AI,还有生态重构、用户需求重构等。此前,在亚马逊云科技CEO Adam Selipsky的演讲中,重构也是成为一大关键词。

数据战略中,持续推动大模型相关技术是关键。但国内在早期拥有大模型能力的公司是极少数,而且国内大模型仍缺乏数据量,做不到高层级的架构。更困难的是,大模型是算力巨兽,依赖高端GPU芯片,一个大模型需数万块GPU,以此推算,是至少几十亿元的投入。这些困境恰是云计算领导者亚马逊云科技的优势,其能全盘承接,并打造出AI发展的新范式。

AI无处不在的时代已经开启。生成式AI堪称通往未来时代的报晓鸟,最终生成式AI将助力成千上万的企业打破数据孤岛,重构AI,重塑数据价值,释放企业的数据潜力。

二、企业数字化转型进入深海区后的数据战略部署

生成式AI时代下,亚马逊云科技制定数据战略的终极目的是助力企业实现数字化转型,提高企业生成式AI创新速度。

几年前,企业数字化转型还是一道选择题,如今俨然成为一道必答题。当下经济下行,企业数字化转型进入深海区,企业在创新的过程中面临了新的机遇和新的挑战,开始加速向广度和深度进发。比如,对企业而言,AI产业前期投入大而后期应用难一直被行业所诟病。当下,降本增效对企业就显得尤为迫切和重要。

这也恰是亚马逊云科技生成式AI时代下数据战略部署的要义所在。一方面差异化产品在生成式AI时代将不再具有竞争壁垒,但差异化数据将可能具有很高价值。

另一方面,生成式AI时代,云计算与经济效应的“飞轮”高度耦合。云计算关键在于弹性、可伸缩、可拓展性带来的成本优化,而生成式AI关键就在于效能提高到某个阈值之后的应用价值急速上升,从而真正赋能众多企业,满足企业主们对于经济效应的最高阶需求。而且,在企业的数字化转型中,没有一种AI模式能适合所有的企业。技术、生态、发展环境都在迅速变化,2023年与原来传统AI服务模式有巨大变化,企业需要随之做出自身数据战略的调整。

一句话,亚马逊云科技通过制定数据战略来实现数据的价值。一个好的数据战略框架可以帮助公司克服重重障碍,并定义更多数据驱动的道路。数据战略是所有数据实践的基础。它不仅仅解决数据问题,它是一个长期的指导性计划,定义了解决数据挑战和支持业务目标所需的人员、流程和技术,包括数据架构与技术、数据分析、数据治理、数据战略路线图、数据成熟度评估、数据变革等等。

在当前的AI爆炸发展的情况下,亚马逊云科技的数据战略是明确且清晰的。接下来,不管AI产业如何演进,出现什么样的创新业态与应用, 只要按照数据战略稳步推进,未来的发展必将可期。

具体而言,数据战略是基于技术为前提。具体到如何通过技术帮助企业客户更高效的使用训练模型,提升效率。亚马逊云科技大中华区战略业务发展部总经理顾凡将其总结为“三横三纵”。

“三横,”即亚马逊云科技重构生成式AI技术的三个层级:最底层是用于训练和推理的「基础设施层」,这里包括一些亚马逊云科技的自研芯片;中间层是微调大模型或基础模型需求的「工具层」;最上层是「生成式AI应用层」。

“三纵”,则是生成式AI的核心原则。其一,负责任的AI,需要有超级丰富且全面的相对应的服务,为客户的所有场景强大的数据存储和分析服务落地;其二,让客户以最低的代价把数据融合起来,真正做到实用性和低成本;其三,如何保护客户私有数据,保证数据的可控性,在鼓励客户把数据用起来数据的同时,数据私密性不能被模型所吸收。可以说,“三横三纵”是当下亚马逊云科技构建生成式AI的关键所在。

有了数据战略和“三横三纵”,亚马逊云科技采用逆向工作法,从客户需求出发。再加上生态、芯片核心能力、企业级生成式AI应用,就能构建一种AI新范式,尽可能匹配这个AI时代下的更多客户的更多需求,解决以前企业无法解决的问题。比如如何做精准预测,如何从大量数据里搜集,如何从这些数据里面去发掘逻辑,真正做到决策支持。

亚马逊云科技分析数据解决方案组合包括云数据仓库服务Amazon Redshift、交互式查询服务Amazon Athena、数据集成服务Amazon Glue和快速构建数据湖的服务Amazon Lake Formation。亚马逊云科技在其所有产品中广泛使用的六个重要的云计算服务属性:安全性、可用性 、可扩展性、性能效率、成本效率和可持续性。

就在上周,亚马逊云科技还推出了数据库和应用领域的三项 Serverless 创新应用,使客户能够更快、更轻松地扩展其数据基础设施,以支持苛刻的业务用例。目前,全球超过150万客户正在使用亚马逊云科技的数据库、分析和机器学习服务。

总之,生成式AI时代正席卷而来,人工智能产业的发展大幕已经拉开。国内的企业们不妨以开放的心态拥抱数字化,用数字化来迎接新的机遇。只有这样,才能穿越周期,行之弥远,改变智能时代企业的发展命运。

这篇关于企业数字化转型进入深海区:生成式AI时代下如何制定数据战略的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/493808

相关文章

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

C#使用iText获取PDF的trailer数据的代码示例

《C#使用iText获取PDF的trailer数据的代码示例》开发程序debug的时候,看到了PDF有个trailer数据,挺有意思,于是考虑用代码把它读出来,那么就用到我们常用的iText框架了,所... 目录引言iText 核心概念C# 代码示例步骤 1: 确保已安装 iText步骤 2: C# 代码程

Pandas处理缺失数据的方式汇总

《Pandas处理缺失数据的方式汇总》许多教程中的数据与现实世界中的数据有很大不同,现实世界中的数据很少是干净且同质的,本文我们将讨论处理缺失数据的一些常规注意事项,了解Pandas如何表示缺失数据,... 目录缺失数据约定的权衡Pandas 中的缺失数据None 作为哨兵值NaN:缺失的数值数据Panda

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

python库pydantic数据验证和设置管理库的用途

《python库pydantic数据验证和设置管理库的用途》pydantic是一个用于数据验证和设置管理的Python库,它主要利用Python类型注解来定义数据模型的结构和验证规则,本文给大家介绍p... 目录主要特点和用途:Field数值验证参数总结pydantic 是一个让你能够 confidentl

JAVA实现亿级千万级数据顺序导出的示例代码

《JAVA实现亿级千万级数据顺序导出的示例代码》本文主要介绍了JAVA实现亿级千万级数据顺序导出的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 前提:主要考虑控制内存占用空间,避免出现同时导出,导致主程序OOM问题。实现思路:A.启用线程池

SpringBoot分段处理List集合多线程批量插入数据方式

《SpringBoot分段处理List集合多线程批量插入数据方式》文章介绍如何处理大数据量List批量插入数据库的优化方案:通过拆分List并分配独立线程处理,结合Spring线程池与异步方法提升效率... 目录项目场景解决方案1.实体类2.Mapper3.spring容器注入线程池bejsan对象4.创建

PHP轻松处理千万行数据的方法详解

《PHP轻松处理千万行数据的方法详解》说到处理大数据集,PHP通常不是第一个想到的语言,但如果你曾经需要处理数百万行数据而不让服务器崩溃或内存耗尽,你就会知道PHP用对了工具有多强大,下面小编就... 目录问题的本质php 中的数据流处理:为什么必不可少生成器:内存高效的迭代方式流量控制:避免系统过载一次性

C#实现千万数据秒级导入的代码

《C#实现千万数据秒级导入的代码》在实际开发中excel导入很常见,现代社会中很容易遇到大数据处理业务,所以本文我就给大家分享一下千万数据秒级导入怎么实现,文中有详细的代码示例供大家参考,需要的朋友可... 目录前言一、数据存储二、处理逻辑优化前代码处理逻辑优化后的代码总结前言在实际开发中excel导入很

MyBatis-plus处理存储json数据过程

《MyBatis-plus处理存储json数据过程》文章介绍MyBatis-Plus3.4.21处理对象与集合的差异:对象可用内置Handler配合autoResultMap,集合需自定义处理器继承F... 目录1、如果是对象2、如果需要转换的是List集合总结对象和集合分两种情况处理,目前我用的MP的版本