巴比特 | 元宇宙每日必读:证监会科技监管局局长姚前建议重点发展基于AIGC技术的合成数据产业,构建大模型训练数据的监管体系...

本文主要是介绍巴比特 | 元宇宙每日必读:证监会科技监管局局长姚前建议重点发展基于AIGC技术的合成数据产业,构建大模型训练数据的监管体系...,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

60ca2694eaa72e4869f4d70afb549d17.gif

摘要:证监会科技监管局局长姚前撰文称,除算力瓶颈之外,训练数据将成为大模型产业化的最大掣肘之一。从更深层次考虑,大模型在训练数据方面还存在各种治理问题。为此,作者提出来三点建议,一是重点发展基于AIGC技术的合成数据产业,二是构建大模型训练数据的监管体系,三是探索基于可信机构或基于可信技术的数据托管方式。(中国金融杂志)

c06afe6d1700019d342221ac3bf25622.png

图片来源:由无界AI绘画工具生成。

热点资讯

苹果新专利:通过对象检测算法为用户提供定制虚拟化身服务

3 月 7 日消息,近日,美国专利商标局公布了一份苹果公司的专利申请,该专利申请涉及下一代虚拟化身/Memoji 定制,允许用户定制眼镜、帽子或其他配件,并通过机器学习过程集成到 Memoji 中。更具体地说,该专利声明“在一些实施方案中,一种或多种计算机视觉(CV)和/或其他启用机器学习(ML)的目标检测算法可应用于注册图像”。

在苹果的专利背景中,他们指出虚拟化身可以提供一定程度的隐私,同时仍然允许用户控制他们的在线身份。作为一种自我表达的手段,许多用户可能希望定制自己的化身,以显示反映用户实际外观的物理特征。用户还可以用各种配件来定制自己的化身,如服装、眼镜、头饰等,这可以反映用户的个人风格、时尚品味和/或现实生活中的外观。

微软将ChatGPT整合到更多工具中,不用写代码就能开发应用

3 月 7 日,据新浪科技报道,微软公司将 ChatGPT 背后的技术整合到其 Power Platform 平台上,允许用户在几乎不需要编码的情况下,就能开发自己的应用程序。微软表示,其 Power Platform 平台上的一系列商业智能和应用程序开发工具,包括 Power 虚拟代理(Power Virtual Agent)和 AI Builder,均已更新 ChatGPT 功能。Power 虚拟代理是一款供企业构建聊天机器人的工具,如今可以连接到公司内部资源,生成周报和客户查询的摘要。此外,微软还为 AI Builder 和 Dynamic 365 添加了 ChatGPT 技术,前者允许企业自动执行工作流程,后者是一个业务管理平台。

美 SEC 正增加员工人数,重点调查 DeFi 平台、NFT 和稳定币等违反证券法的行为

据福布斯 3 月 7 日报道,美国证券交易委员会(SEC)正在增加员工人数,增强审查、调查、审计、检查和可能起诉与这些新加密产品和交易活动相关的证券法违法行为的能力。新增的工作人员将包括监管人员、调查人员律师、欺诈分析师和出庭律师,重点调查以下方面违反证券法的行为:加密资产发行、交易以及借贷和质押产品;DeFi 平台;NFT 和稳定币。

市场调查机构:英伟达可从 ChatGPT 赚取 3 亿美元

3 月 7 日,市场调查机构 TrendForce 集邦咨询公布的最新报告指出,如果以英伟达 A100 显卡的处理能力计算,运行 ChatGPT 将需要使用到 30000 块英伟达 GPU。目前英伟达 A100 显卡的售价在 10000-15000 美元之间,该售价取决于 OpenAI 需要多少显卡,以及英伟达是否会为 AI 公司提供订单折扣。TrendForce 预估英伟达可以赚取超过 3 亿美元。

外媒:亚马逊预计将于 4 月 24 日推出 NFT 平台

据 Thebigwhale 报道,电商巨头亚马逊预计将于 4 月 24 日推出其 NFT 平台,此次发布将推出约 15 个系列。此前据 Blockworks 报道,四位消息人士称,亚马逊正在推出一个数字资产企业,NFT 计划预计将在春季推出。

元宇宙荐读

《姚前:ChatGPT类大模型训练数据的托管与治理》

ChatGPT的主要魅力在于,它利用从互联网获取的海量训练数据开展深度学习和强化学习,可以给用户带来全新的“人机对话”体验。海量训练数据可谓是维系ChatGPT进化的核心要素之一。有研究预测,按照目前的发展速度,到2026年ChatGPT类大模型的训练将耗尽互联网上的可用文本数据,届时将没有新的训练数据可供使用。因此,算力瓶颈之外,训练数据将成为大模型产业化的最大掣肘之一。

https://www.8btc.com/article/6807648

《投资者:AIGC是现阶段重点投资领域,整体乐观,但出手谨慎》

AIGC看了有半年了,到现在为止都没看到合适的项目。”聊起近来的投资方向,一名北京的投资人冯奇(化名)略显遗憾地告诉《科创板日报》记者。冯奇说,他所在的机构从去年stable diffusion开源以后,就一直在关注AIGC领域,尤其在ChatGPT出现之后,对于生成式AI,大家基本形成了共识,“这是一个重要的、有机会的市场”。

https://www.8btc.com/article/6807594‌

《Meta版ChatGPT开源代码遭泄漏,开发者称新 AI 大模型推理速度优于GPT》

3月5日,一位名为@Enryu 的开发者在Medium平台发文,比较了LLaMA和ChatGPT在多个开发挑战任务中的效果。结果显示,LLaMA训练过程算法大部分比ChatGPT训练更快、更便宜。他认为,与ChatGPT相比,LLaMA架构更小,但训练过程和单GPU(图形处理器)芯片推理速度更快,成本更低,而且该库还支持所有LLaMA模型架构,用户可对模型进行微调等。

https://www.8btc.com/article/6807678‌

巴比特园区开放合作啦!

b037057fd9d3106d74683974a1b88271.png

000dcf35579864b6ef18d047a75ced17.jpeg

fba462a5df6e65a3eb9594b9bda0e73c.gif

中文推特:https://twitter.com/8BTC_OFFICIAL

英文推特:https://twitter.com/btcinchina

Discord社区:https://discord.gg/defidao

电报频道:https://t.me/Mute_8btc

电报社区:https://t.me/news_8btc

8e8ea5020cb50593cfe8c98d95e08f7c.jpeg

这篇关于巴比特 | 元宇宙每日必读:证监会科技监管局局长姚前建议重点发展基于AIGC技术的合成数据产业,构建大模型训练数据的监管体系...的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/670925

相关文章

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

C#使用iText获取PDF的trailer数据的代码示例

《C#使用iText获取PDF的trailer数据的代码示例》开发程序debug的时候,看到了PDF有个trailer数据,挺有意思,于是考虑用代码把它读出来,那么就用到我们常用的iText框架了,所... 目录引言iText 核心概念C# 代码示例步骤 1: 确保已安装 iText步骤 2: C# 代码程

Pandas处理缺失数据的方式汇总

《Pandas处理缺失数据的方式汇总》许多教程中的数据与现实世界中的数据有很大不同,现实世界中的数据很少是干净且同质的,本文我们将讨论处理缺失数据的一些常规注意事项,了解Pandas如何表示缺失数据,... 目录缺失数据约定的权衡Pandas 中的缺失数据None 作为哨兵值NaN:缺失的数值数据Panda

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

使用Node.js和PostgreSQL构建数据库应用

《使用Node.js和PostgreSQL构建数据库应用》PostgreSQL是一个功能强大的开源关系型数据库,而Node.js是构建高效网络应用的理想平台,结合这两个技术,我们可以创建出色的数据驱动... 目录初始化项目与安装依赖建立数据库连接执行CRUD操作查询数据插入数据更新数据删除数据完整示例与最佳

Linux五种IO模型的使用解读

《Linux五种IO模型的使用解读》文章系统解析了Linux的五种IO模型(阻塞、非阻塞、IO复用、信号驱动、异步),重点区分同步与异步IO的本质差异,强调同步由用户发起,异步由内核触发,通过对比各模... 目录1.IO模型简介2.五种IO模型2.1 IO模型分析方法2.2 阻塞IO2.3 非阻塞IO2.4

python库pydantic数据验证和设置管理库的用途

《python库pydantic数据验证和设置管理库的用途》pydantic是一个用于数据验证和设置管理的Python库,它主要利用Python类型注解来定义数据模型的结构和验证规则,本文给大家介绍p... 目录主要特点和用途:Field数值验证参数总结pydantic 是一个让你能够 confidentl

JAVA实现亿级千万级数据顺序导出的示例代码

《JAVA实现亿级千万级数据顺序导出的示例代码》本文主要介绍了JAVA实现亿级千万级数据顺序导出的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 前提:主要考虑控制内存占用空间,避免出现同时导出,导致主程序OOM问题。实现思路:A.启用线程池

Docker多阶段镜像构建与缓存利用性能优化实践指南

《Docker多阶段镜像构建与缓存利用性能优化实践指南》这篇文章将从原理层面深入解析Docker多阶段构建与缓存机制,结合实际项目示例,说明如何有效利用构建缓存,组织镜像层次,最大化提升构建速度并减少... 目录一、技术背景与应用场景二、核心原理深入分析三、关键 dockerfile 解读3.1 Docke

SpringBoot分段处理List集合多线程批量插入数据方式

《SpringBoot分段处理List集合多线程批量插入数据方式》文章介绍如何处理大数据量List批量插入数据库的优化方案:通过拆分List并分配独立线程处理,结合Spring线程池与异步方法提升效率... 目录项目场景解决方案1.实体类2.Mapper3.spring容器注入线程池bejsan对象4.创建