成立 15 年的美图分享,AI 视觉大模型的核心能力是什么?

2023-10-13 17:36

本文主要是介绍成立 15 年的美图分享,AI 视觉大模型的核心能力是什么?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

出品 | CSDN 云计算

国民级美颜修图软件美图秀秀,从移动互联网时代火到现在,而它背后的美图公司也走过了十五年的发展,旗下拥有众多的专业影像与设计产品。最近,美图公司举办 15 周年生日会,生日会上美图还发布了自研 AI 视觉大模型 MiracleVision(奇想智能)的 3.0 版本,以及 3.0 版本的最新进展与对视觉大模型的深刻洞察。

AI 视觉大模型的成熟,还有多久?

今年初 AIGC 爆火,语言与视觉大模型纷纷涌现。视觉大模型对生产与交付效率的提升,已经成为包括设计在内的全行业共识。不过所有精美的 AI 图片背后,生成图片视频的效果、模型的可控性,以及部署和运行使用大模型的成本,可能并不像业界想象中的那么轻松简单。

美图公司创始人、董事长兼首席执行官吴欣鸿分享了目前 AI 视觉大模型在生产端的三个待解决的问题是:垂直领域的极致效果、工作流整合、变现能力。想要实现垂直领域极致的效果,需要高质量的行业数据,以及对模型进行领域内的进一步定向训练。而将大模型整合进工作流,需要大模型可以支持高精度调节,以及上下游协同。当然,模型的变现更需要对商业场景的摸索和理解,以及如何去提升极致效果之后的商业转化率。吴欣鸿提到,随着 AI 视觉大模型和生产端的磨合,这三个问题都将被逐步解决。

美图与吴欣鸿还分享了另一个观察,任务视觉大模型应用普及将经历三个阶段。现在 2023 年为探索期,因此大模型生成的作品效果可能平均只有及格水准,而且仅能单任务运行。2024-2025 年为高速发展期,AI 视觉的作品效果将提升,工作流升级,应用场景也更加明确。2026-2030 年或将是 AI 视觉大模型的成熟期,普及率可能达到 80%。随着视觉大模型在生产端的应用走向成熟,视觉大模型将助力千万设计场景,引领美学的升级与社会经济增长。

美图自研 AI 视觉大模型 MiracleVision 3.0 已经可以做什么

从移动开发时代就深耕影像视觉技术的美图在今年 6 月推出了自研的视觉大模型 MiracleVision。在十五周年生日会上,美图推出了 MiracleVision 的 3.0 版本,MiracleVision 3.0 将全面应用于美图旗下影像与设计产品,并将助力电商、广告、游戏、动漫、影视五大行业。

美图公司将自研 AI 视觉大模型 MiracleVision(奇想智能)的核心能力拆解为“奇思妙想”和“智能创作”两大特性。在“奇思妙想”层面,MiracleVision 通过“提示词智能联想”功能降低大众的使用门槛,当用户输入关键词,MiracleVision 可自动补充相关表述,如光影效果、质感、风格、图片质量等,推动创作平权。此外,MiracleVision 通过“提示词精准控制”功能来满足更加专业的设计要求,如使用“近景”、“远景”、“顺光”、“逆光”等描述控制最终生成效果。在“智能创作”层面,MiracleVision 通过“深化创作”功能,可以进一步丰富作品细节和提升表现力。通过“AI 画面扩展”功能让作品尺寸更大、细节更丰富。通过“局部修改”功能,对部分画面进行精准修改与调整。通过“分辨率提升”功能生成高清大图,让细节表现、色彩展示、物体辨识更加的精准和生动。

三个月迭代到 3.0 版本,已经是非常快的速度。美图公司技术副总裁、美图影像研究院(MT Lab)负责人刘洛麒在采访时表示,在 1.0 阶段,团队搭建了 MiracleVision 大模型的架构与基础平台,2.0 阶段则开始体现美图视觉大模型的独特优势,那就是美学的倾向性与评估体系,美图团队与外部设计师、艺术院校共同构建了高质量的数据集。现在的 3.0 阶段,大模型将更强调模型的可控性,让用户不论是在细节控制还是局部编辑,所需的作品质量与效果,都能在 MiracleVision 大模型技术层面实现。

具体的行业与场景方面,在电商行业,从涂鸦生成线稿、线稿上色、商品图、模特试穿图,再到电商物料输出,全程可通过 MiracleVision 实现。在广告行业,MiracleVision 覆盖创意脑暴、创意深化、平面排版、多尺寸延展、线下投放预览的全工作流,助力客户在广告物料制作环节提效。在游戏行业,MiracleVision 可以包揽场景设计、角色设计、道具设计、UI 图标、宣发物料等流程,拓宽设计师想象空间的同时助力游戏行业降本。在动漫行业,MiracleVision 打通了概念设计、故事板生成、线稿上色、动漫补帧、视频转动漫等流程,支持创意到物料成品的快速落地。在影视行业,MiracleVision 的高可控性可充分满足概念场景设计、分镜设计、人物造型、道具设计、宣发物料的效果要求,极大提升影视行业设计环节的效率。

除了重磅的 MiracleVision 3.0,在生日会上,美图公司也公布了 6 月 19 日发布的影像生产力工具最新数据:AI 视觉创作工具“WHEE”的优质 AI 效果生成数已超过 550 万张,打造的设计师生态也初见成效;AI 口播视频工具“开拍”月活跃用户数已突破 35 万;桌面端 AI 视频编辑工具“WinkStudio”已累计服务近 10 万名视频创作者;主打 AI 商业设计的“美图设计室”正助力近百万中小电商卖家降本增效;美图 AI 助手“RoboNeo”每天帮助近万名用户自动修图,比传统修图效率提升 35%;AI 数字人生成工具“DreamAvatar”于 8 月底上线并主打“AI 演员”数字人服务。

我们能看到,从机器学习到大模型,美图在视觉 AI 技术上的探索已经初见成效。美图对于 AI 视觉大模型的技术与产品的思考、分享,也推荐对 AI 视觉技术感兴趣的开发者重点关注。CSDN 将持续报道大模型的最近技术趋势与实践。

这篇关于成立 15 年的美图分享,AI 视觉大模型的核心能力是什么?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/204824

相关文章

Python异常处理之避免try-except滥用的3个核心原则

《Python异常处理之避免try-except滥用的3个核心原则》在Python开发中,异常处理是保证程序健壮性的关键机制,本文结合真实案例与Python核心机制,提炼出避免异常滥用的三大原则,有需... 目录一、精准打击:只捕获可预见的异常类型1.1 通用异常捕获的陷阱1.2 精准捕获的实践方案1.3

Linux五种IO模型的使用解读

《Linux五种IO模型的使用解读》文章系统解析了Linux的五种IO模型(阻塞、非阻塞、IO复用、信号驱动、异步),重点区分同步与异步IO的本质差异,强调同步由用户发起,异步由内核触发,通过对比各模... 目录1.IO模型简介2.五种IO模型2.1 IO模型分析方法2.2 阻塞IO2.3 非阻塞IO2.4

深入浅出Java中的Happens-Before核心规则

《深入浅出Java中的Happens-Before核心规则》本文解析Java内存模型中的Happens-Before原则,解释其定义、核心规则及实际应用,帮助理解多线程可见性与有序性问题,掌握并发编程... 目录前言一、Happens-Before是什么?为什么需要它?1.1 从一个问题说起1.2 Haht

Java+AI驱动实现PDF文件数据提取与解析

《Java+AI驱动实现PDF文件数据提取与解析》本文将和大家分享一套基于AI的体检报告智能评估方案,详细介绍从PDF上传、内容提取到AI分析、数据存储的全流程自动化实现方法,感兴趣的可以了解下... 目录一、核心流程:从上传到评估的完整链路二、第一步:解析 PDF,提取体检报告内容1. 引入依赖2. 封装

Python内存优化的实战技巧分享

《Python内存优化的实战技巧分享》Python作为一门解释型语言,虽然在开发效率上有着显著优势,但在执行效率方面往往被诟病,然而,通过合理的内存优化策略,我们可以让Python程序的运行速度提升3... 目录前言python内存管理机制引用计数机制垃圾回收机制内存泄漏的常见原因1. 循环引用2. 全局变

Python进阶之列表推导式的10个核心技巧

《Python进阶之列表推导式的10个核心技巧》在Python编程中,列表推导式(ListComprehension)是提升代码效率的瑞士军刀,本文将通过真实场景案例,揭示列表推导式的进阶用法,希望对... 目录一、基础语法重构:理解推导式的底层逻辑二、嵌套循环:破解多维数据处理难题三、条件表达式:实现分支

深度解析Python yfinance的核心功能和高级用法

《深度解析Pythonyfinance的核心功能和高级用法》yfinance是一个功能强大且易于使用的Python库,用于从YahooFinance获取金融数据,本教程将深入探讨yfinance的核... 目录yfinance 深度解析教程 (python)1. 简介与安装1.1 什么是 yfinance?

Linux从文件中提取特定内容的实用技巧分享

《Linux从文件中提取特定内容的实用技巧分享》在日常数据处理和配置文件管理中,我们经常需要从大型文件中提取特定内容,本文介绍的提取特定行技术正是这些高级操作的基础,以提取含有1的简单需求为例,我们可... 目录引言1、方法一:使用 grep 命令1.1 grep 命令基础1.2 命令详解1.3 高级用法2

深度解析Spring Security 中的 SecurityFilterChain核心功能

《深度解析SpringSecurity中的SecurityFilterChain核心功能》SecurityFilterChain通过组件化配置、类型安全路径匹配、多链协同三大特性,重构了Spri... 目录Spring Security 中的SecurityFilterChain深度解析一、Security

使用IDEA部署Docker应用指南分享

《使用IDEA部署Docker应用指南分享》本文介绍了使用IDEA部署Docker应用的四步流程:创建Dockerfile、配置IDEADocker连接、设置运行调试环境、构建运行镜像,并强调需准备本... 目录一、创建 dockerfile 配置文件二、配置 IDEA 的 Docker 连接三、配置 Do