每日一看大模型新闻(2023.11.20)

2024-01-12 00:04

本文主要是介绍每日一看大模型新闻(2023.11.20),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1.产品发布

1.1长虹:首个基于大模型的智慧家电AI平台

发布日期:2023.11.20

全球首个基于大模型智慧家电AI平台长虹云帆震撼发布!

主要内容:长虹智慧AI平台发布会上,发布了全球首个基于大模型的智慧家电AI平台——长虹云帆。据介绍,云帆AI平台具备多维感知、多重理解、多任务管理、多模交互、内容激发五大能力,目前长虹的8K系列、ARTIST星箔系列、288Hz超羽速系列电视已首批搭载。此外,长虹还发布了一款具有超级连接能力的电视——全球首台星闪电视。

1.2招商轮船发布“ShippingGPT”航运大模型

发布日期:2023.11.20

招商局航运大模型“ShippingGPT”11月20日发布|航运_新浪财经_新浪网

主要内容:招商轮船宣布将在第三届世界航商大会上发布航运大模型“ShippingGPT”。该模型基于“商道”行业大模型,集成航运领域知识,通过“世界航商”APP免费向全球开放。 "ShippingGPT"经过训练,包含海量航运物流知识,可用于船舶管理、市场分析、法律问答等,具备航运物流知识检索与问答、航运市场信息结构化查询问答等功能。

2.技术更新

2.1 OpenAI安全系统负责人长文梳理:大模型的对抗攻击与防御

发布日期:2023.11.20

OpenAI安全系统负责人长文梳理:大模型的对抗攻击与防御 - 知乎

主要内容:这篇文章介绍了大型语言模型(LLM)可能面临的对抗攻击类型和防御方法。LLM 的强大能力使其在受到恶意攻击时可能产生严重后果,因此研究如何防御对抗攻击至关重要。文章列举了几种常见的对抗攻击类型,包括基于 token 操作的攻击和基于梯度的攻击,并简要介绍了防御方法。随着 ChatGPT 等大型语言模型应用的加速普及,研究如何在对齐过程中为模型构建默认的安全行为显得尤为重要。

2.2谷歌:推出新图像控制方式,在生成中保证内容特征一致性

发布日期:2023.11.20

谷歌推出新图像控制方式 可在StableDiffusion图像生成中保证内容特征一致性_凤凰网

主要内容:谷歌推出了一项新的图像生成技术,通过确保内容特征的一致性,可以生成具有相同视觉特征的连贯图像。这对于故事可视化、游戏开发和广告等领域非常重要,因为在生成过程中,角色或内容的一致性是必需的。该技术的实现方法包括三个步骤。首先是身份聚类,通过生成一系列图像并将其嵌入到语义空间中,使用聚类算法将这些图像分组,每个组代表一种可能的角色身份。这个过程旨在识别出一组视觉上一致的图像,从而确定角色的主要视觉特征。接下来是身份提取,一旦确定了一组具有高内聚性的图像,就会在这些图像上训练模型,以提取更一致的角色身份。这意味着模型将学习特定角色的关键视觉特征,以便在未来的生成中更准确地重现这些特征。

论文地址:https://arxiv.org/pdf/2311.10093.pdf

2.3真正实现一步文生图,谷歌UFOGen极速采样,生成高质量图像

发布日期:2023.11.20

真正实现一步文生图,谷歌UFOGen极速采样,生成高质量图像

主要内容:谷歌的研究团队提出了 UFOGen 模型,一种能极速采样的扩散模型变种。通过论文提出的方法对 Stable Diffusion 进行微调,UFOGen 只需要一步就能生成高质量的图片。与此同时,Stable Diffusion 的下游应用,比如图生图,ControlNet 等能力也能得到保留。提升扩散模型的生成速度并不是一个新的研究方向。之前关于这方面的研究主要集中在两个方向。一个方向是设计更高效的数值计算方法,以求能达到利用更少的离散步数求解扩散模型的采样 ODE 的目的。另一个方向是利用知识蒸馏的方法,将模型的基于 ODE 的采样路径压缩到更小的步数。

论文链接:https://arxiv.org/abs/2311.09257

2.4 OpenAI安全系统负责人长文梳理:大模型的对抗攻击与防御

发布日期:2023.11.20

OpenAI安全系统负责人长文梳理:大模型的对抗攻击与防御

主要内容:随着 ChatGPT 的发布,大型语言模型应用正在加速大范围铺开。OpenAI 的安全系统团队已经投入了大量资源,研究如何在对齐过程中为模型构建默认的安全行为。但是,对抗攻击或 prompt 越狱依然有可能让模型输出我们不期望看到的内容。目前在对抗攻击方面的研究很多集中在图像方面,也就是在连续的高维空间。而对于文本这样的离散数据,由于缺乏梯度信号,人们普遍认为攻击会困难得多。Lilian Weng 之前曾写过一篇文章《Controllable Text Generation》探讨过这一主题。简单来说:攻击 LLM 本质上就是控制该模型输出特定类项的(不安全)内容。另一个研究攻击 LLM 的分支是为了提取预训练数据、私有知识,或通过数据毒化攻击模型训练过程。但这些并非本文要探讨的主题。

文章地址:

https://lilianweng.github.io/posts/2021-01-02-controllable-text-generation/ 

3.商业动态

3.1普华永道爱尔兰与微软合作开设新的生成式AI中心

发布日期:2023.11.20

普华永道爱尔兰与微软合作开设新的生成式AI中心,促进技术的采用_凤凰网

主要内容:普华永道爱尔与微软合作,在都柏林北墙码头的爱尔兰总部开设了一个新的生成式人工智能业务中心。该中心旨在推动新技术的采用,并以安全可靠的方式推动必要的投资回报。普华永道表示,生成式人工智能有潜力通过自动化任务、解决问题和创造新机会来改变行业。此前,普华永道通过与微软的合作在全球范围内投资了超过10亿欧元,推动人工智能和技术驱动的转型。然而,调查显示,爱尔兰在人工智能和生成式人工智能的采用上较为缓慢。只有不到10%的企业大规模采用了人工智能,而美国的比例为26%。尽管如此,61%的爱尔兰企业表示正在考虑采用人工智能。普华永道爱尔的管理合伙人认为新中心是重要的投资,相信它将实现工作交付方式上的飞跃,并与技术驱动变革前沿保持一致。与微软的战略合作将使他们能够安全可靠地利用生成式人工智能,树立信任并实现持续的客户成果。

3.2亚马逊:推出了AI Ready计划,提供免费AI培训

发布日期:2023.11.20

New Amazon AI initiative includes scholarships, free AI courses

主要内容:亚马逊推出了AI Ready计划,旨在在2025年前为全球200万人提供免费的AI技能培训。该计划提出了三项新举措:开设8门全新的免费AI和生成式AI课程;设立AWS生成式AI奖学金,为全球超过5万名高中生和大学生提供在线学习网站Udacity上新的生成式AI课程的机会;与教育创新非营利组织Code.org建立合作关系

4.其他资讯

4.1早期胰腺癌筛查,医疗AI技术成果登Nature Medicine

发布日期:2023.11.20

Large-scale pancreatic cancer detection via non-contrast CT and deep learning | Nature Medicine

主要内容:国际医学顶级期刊《自然医学》表示,通过“平扫CT+AI”,人类首次拥有了大规模早期胰腺癌的筛查手段。阿里达摩院(湖畔实验室)与全球十多家顶尖医疗机构合作,将AI用于体检中心、医院等无症状人群的胰腺癌筛查,只需进行最简单的平扫CT,就在2万多真实世界连续病人群体中发现了31例临床漏诊病变,其中2例早期胰腺癌病患已完成手术治愈。《自然医学》专门发表评论文章:“基于医疗影像AI的癌症筛查即将进入黄金时代”。

4.2谷歌Bard「破防」,用自然语言破解,提示注入引起数据泄漏风险

发布日期:2023.11.20

谷歌Bard「破防」,用自然语言破解,提示注入引起数据泄漏风险

主要内容:如果用户有意在输入提示词时,模仿系统指令,那么模型可能在对话里透露一些只有它才知道的「秘密」。最近,谷歌 Bard 迎来了一波强大的更新,Bard 增加了拓展功能,支持访问 YouTube,搜索航班和酒店,还能查阅用户的个人文件和邮件。除此之外,Bard 可以连接到「谷歌全家桶」,访问你的谷歌云盘、文档和邮件!但这同时意味着 Bard 将分析不受信任的数据,容易受间接提示注入的影响。也就是说,不怀好意的人可能通过向你发送电子邮件或强行分享谷歌文档进行间接的提示注入攻击,因为对方发什么样的邮件、文档给你,你是控制不了的,但 Bard 却会无差别访问。

这篇关于每日一看大模型新闻(2023.11.20)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/596144

相关文章

Spring Security基于数据库的ABAC属性权限模型实战开发教程

《SpringSecurity基于数据库的ABAC属性权限模型实战开发教程》:本文主要介绍SpringSecurity基于数据库的ABAC属性权限模型实战开发教程,本文给大家介绍的非常详细,对大... 目录1. 前言2. 权限决策依据RBACABAC综合对比3. 数据库表结构说明4. 实战开始5. MyBA

Java的IO模型、Netty原理解析

《Java的IO模型、Netty原理解析》Java的I/O是以流的方式进行数据输入输出的,Java的类库涉及很多领域的IO内容:标准的输入输出,文件的操作、网络上的数据传输流、字符串流、对象流等,这篇... 目录1.什么是IO2.同步与异步、阻塞与非阻塞3.三种IO模型BIO(blocking I/O)NI

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》:本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)

《C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)》本文主要介绍了C#集成DeepSeek模型实现AI私有化的方法,包括搭建基础环境,如安装Ollama和下载DeepS... 目录前言搭建基础环境1、安装 Ollama2、下载 DeepSeek R1 模型客户端 ChatBo

SpringBoot快速接入OpenAI大模型的方法(JDK8)

《SpringBoot快速接入OpenAI大模型的方法(JDK8)》本文介绍了如何使用AI4J快速接入OpenAI大模型,并展示了如何实现流式与非流式的输出,以及对函数调用的使用,AI4J支持JDK8... 目录使用AI4J快速接入OpenAI大模型介绍AI4J-github快速使用创建SpringBoot

0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型的操作流程

《0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeekR1模型的操作流程》DeepSeekR1模型凭借其强大的自然语言处理能力,在未来具有广阔的应用前景,有望在多个领域发... 目录0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型,3步搞定一个应

Deepseek R1模型本地化部署+API接口调用详细教程(释放AI生产力)

《DeepseekR1模型本地化部署+API接口调用详细教程(释放AI生产力)》本文介绍了本地部署DeepSeekR1模型和通过API调用将其集成到VSCode中的过程,作者详细步骤展示了如何下载和... 目录前言一、deepseek R1模型与chatGPT o1系列模型对比二、本地部署步骤1.安装oll

Spring AI Alibaba接入大模型时的依赖问题小结

《SpringAIAlibaba接入大模型时的依赖问题小结》文章介绍了如何在pom.xml文件中配置SpringAIAlibaba依赖,并提供了一个示例pom.xml文件,同时,建议将Maven仓... 目录(一)pom.XML文件:(二)application.yml配置文件(一)pom.xml文件:首

如何在本地部署 DeepSeek Janus Pro 文生图大模型

《如何在本地部署DeepSeekJanusPro文生图大模型》DeepSeekJanusPro模型在本地成功部署,支持图片理解和文生图功能,通过Gradio界面进行交互,展示了其强大的多模态处... 目录什么是 Janus Pro1. 安装 conda2. 创建 python 虚拟环境3. 克隆 janus

本地私有化部署DeepSeek模型的详细教程

《本地私有化部署DeepSeek模型的详细教程》DeepSeek模型是一种强大的语言模型,本地私有化部署可以让用户在自己的环境中安全、高效地使用该模型,避免数据传输到外部带来的安全风险,同时也能根据自... 目录一、引言二、环境准备(一)硬件要求(二)软件要求(三)创建虚拟环境三、安装依赖库四、获取 Dee