用50张图训练,就能识别高仿山寨货!阿里安全图灵实验室获ECCV 2020挑战赛冠军...

本文主要是介绍用50张图训练,就能识别高仿山寨货!阿里安全图灵实验室获ECCV 2020挑战赛冠军...,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

贾浩楠 发自 凹非寺
量子位 报道 | 公众号 QbitAI

阿里AI最近拿到了一个“世界第一”:计算机视觉领域顶会ECCV 2020 VIPriors挑战赛分类赛道冠军。

仅用50张图片训练,然后识别特定类别的物体,阿里安全团队的算法击败了所有参赛对手。

阿里的高效分类AI模型,可以解决戴口罩的人脸识别问题;还可以打假,识别零售市场的高仿山寨货。

训练数据50张图,堪称最难分类算法挑战

ECCV 2020 VIPriors挑战赛最困难的一点,是1000个数据类别中,每个类别仅有50张图片作为训练数据

参赛者的模型,必须能在这种训练数据极少的情况下,实现对于目标高精度识别分类。

这样的难度,对于传统的AI模型来讲,几乎是不可能的任务。因为它们普遍需要海量带标签训练数据作为基石,才能保证AI模型的效果。

但是数据的收集和标注需要昂贵的人力成本,需要从不同的角度、光照条件和位置拍摄、收集几千甚至上万张图片并进行标注。

根据招聘平台信息,北京地区,数据标注师的月薪普遍在5000-8000,有数据采集技能的标注师月薪往往超过10000。而数据标注师的培训讲解岗,工资则超过2万。

ECCV 2020 VIPriors挑战赛的初衷,就是鼓励探索能够高效学习的AI神经网络,降低神经网络训练过程中的人力标注成本和计算资源消耗,使用极少的训练数据,一块GPU也可以完成

在分类赛道上,比赛数据基于ImageNet抽取,1000个类别,每个类别仅使用50张图像,训练集共5w张图片,规模仅为Imagenet的1/26。

比赛规定模型只能train from scratch,不能使用额外的训练数据,不能使用预训练模型,不能使用迁移学习,排名以测试集上的Top-1 Accuracy为准。

戴口罩识别+AI零售打假

在比赛中,面对50张训练图片的苛刻要求,阿里安全图灵实验室的智能算法团队从三个技术方向进行了突破:

利用随机抽取的两张训练图像,使用数据增强并进行拼接,最大程度丰富训练样本资源;

设计独特的神经网络结构,加入显著性特征模块挖掘样本的特点,提升分类性能;

利用分层语义结构,让AI模型更好地挖掘数据,实现更好的学习效果。

这三点创新方法,同时与自监督有效结合,在学习更好的数据表征基础上,指导模型高效学习,获得更好的识别能力。

获得了冠军,这项高效AI方案有什么实际应用呢?

阿里安全图灵实验室资深算法专家薛晖介绍,疫情期间,突发口罩佩戴问题使得大量人脸门禁失效,很多小区需要摘下口罩刷脸,带来不必要的健康风险。

而高效AI分类技术的应用大大降低了模型初始化的数据需求量,帮助快速训练好模型,解决了戴口罩的人脸识别问题。

此外,这项AI技术还能用于打假,识别山寨仿冒商品,并且已经投入使用。

对于零售场景,无论是线上还是线下,对于刚刚上新的某种产品,往往是样本数量较少,预训练任务和目标任务存在差异,预训练模型可能损害目标任务的准确率。而高效AI方案恰恰能够解决上述问题。

以某知名品牌运动鞋上新为例,一段时间内仅能获得该产品不同的配色以及商品几个不同角度的图片。

在仅有少量商品展示图的情况下,通过高效AI方案,在新产品问世的极短时间内就能实现新款商品识别能力的覆盖,降低新产品被山寨和假冒的风险

对于在网上购物的你我来说,这项技术使消费者大大降低了碰到真假难辨的高仿货几率。

不用消费者自己动手部署算法去识别商品,阿里安全的高效AI方案在平台端部署,在商品陈列阶段就尽量保证真品,避免出现鱼龙混杂的情况。


除了零售打假,在其他识别类别多、每个类别样本数量很少的场景,比如知识产权商标识别通用商品识别动植物保护等等,阿里的高效AI方案都有用武之地。

目前高效AI方案对内已应用到了阿里多个业务场景,如淘宝视频、淘宝直播、优酷等平台的知识产权保护,为数字基建的安全建设提供样本参考,对外则通过绿网直接服务大中小企业。

阿里安全图灵实验室

阿里安全图灵实验室是阿里巴巴从事安全领域机器学习研发的顶级团队,专注于 CV、NLP 及 ML 领域,团队所研发的 AI 技术被广泛用于阿里巴巴经济体的全球业务网络安全、数据安全、知识产权、新零售安全以及风控反作弊等业务场景。

今年分类赛道共有来自全球的56位选手参与,最终,阿阿里安全的高效AI分类技术超越三星、同济大学等国内外多支队伍的同类技术,勇夺冠军。

“A visual inductive priors framework for data-efficient image classification”也已经被ECCV 2020 Workshop VIPriors接收。

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

每天5分钟,抓住行业发展机遇

如何关注、学习、用好人工智能? 

每个工作日,量子位AI内参精选全球科技和研究最新动态,汇总新技术、新产品和新应用,梳理当日最热行业趋势和政策,搜索有价值的论文、教程、研究等。

同时,AI内参群为大家提供了交流和分享的平台,更好地满足大家获取AI资讯、学习AI技术的需求。扫码即可订阅:

加入AI社群,与优秀的人交流

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

这篇关于用50张图训练,就能识别高仿山寨货!阿里安全图灵实验室获ECCV 2020挑战赛冠军...的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/232508

相关文章

Nginx安全防护的多种方法

《Nginx安全防护的多种方法》在生产环境中,需要隐藏Nginx的版本号,以避免泄漏Nginx的版本,使攻击者不能针对特定版本进行攻击,下面就来介绍一下Nginx安全防护的方法,感兴趣的可以了解一下... 目录核心安全配置1.编译安装 Nginx2.隐藏版本号3.限制危险请求方法4.请求限制(CC攻击防御)

Python实现对阿里云OSS对象存储的操作详解

《Python实现对阿里云OSS对象存储的操作详解》这篇文章主要为大家详细介绍了Python实现对阿里云OSS对象存储的操作相关知识,包括连接,上传,下载,列举等功能,感兴趣的小伙伴可以了解下... 目录一、直接使用代码二、详细使用1. 环境准备2. 初始化配置3. bucket配置创建4. 文件上传到os

Java 线程安全与 volatile与单例模式问题及解决方案

《Java线程安全与volatile与单例模式问题及解决方案》文章主要讲解线程安全问题的五个成因(调度随机、变量修改、非原子操作、内存可见性、指令重排序)及解决方案,强调使用volatile关键字... 目录什么是线程安全线程安全问题的产生与解决方案线程的调度是随机的多个线程对同一个变量进行修改线程的修改操

Python中图片与PDF识别文本(OCR)的全面指南

《Python中图片与PDF识别文本(OCR)的全面指南》在数据爆炸时代,80%的企业数据以非结构化形式存在,其中PDF和图像是最主要的载体,本文将深入探索Python中OCR技术如何将这些数字纸张转... 目录一、OCR技术核心原理二、python图像识别四大工具库1. Pytesseract - 经典O

Python基于微信OCR引擎实现高效图片文字识别

《Python基于微信OCR引擎实现高效图片文字识别》这篇文章主要为大家详细介绍了一款基于微信OCR引擎的图片文字识别桌面应用开发全过程,可以实现从图片拖拽识别到文字提取,感兴趣的小伙伴可以跟随小编一... 目录一、项目概述1.1 开发背景1.2 技术选型1.3 核心优势二、功能详解2.1 核心功能模块2.

Java中常见队列举例详解(非线程安全)

《Java中常见队列举例详解(非线程安全)》队列用于模拟队列这种数据结构,队列通常是指先进先出的容器,:本文主要介绍Java中常见队列(非线程安全)的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录一.队列定义 二.常见接口 三.常见实现类3.1 ArrayDeque3.1.1 实现原理3.1.2

Python验证码识别方式(使用pytesseract库)

《Python验证码识别方式(使用pytesseract库)》:本文主要介绍Python验证码识别方式(使用pytesseract库),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全... 目录1、安装Tesseract-OCR2、在python中使用3、本地图片识别4、结合playwrigh

使用Python和PaddleOCR实现图文识别的代码和步骤

《使用Python和PaddleOCR实现图文识别的代码和步骤》在当今数字化时代,图文识别技术的应用越来越广泛,如文档数字化、信息提取等,PaddleOCR是百度开源的一款强大的OCR工具包,它集成了... 目录一、引言二、环境准备2.1 安装 python2.2 安装 PaddlePaddle2.3 安装

JAVA保证HashMap线程安全的几种方式

《JAVA保证HashMap线程安全的几种方式》HashMap是线程不安全的,这意味着如果多个线程并发地访问和修改同一个HashMap实例,可能会导致数据不一致和其他线程安全问题,本文主要介绍了JAV... 目录1. 使用 Collections.synchronizedMap2. 使用 Concurren

springboot整合阿里云百炼DeepSeek实现sse流式打印的操作方法

《springboot整合阿里云百炼DeepSeek实现sse流式打印的操作方法》:本文主要介绍springboot整合阿里云百炼DeepSeek实现sse流式打印,本文给大家介绍的非常详细,对大... 目录1.开通阿里云百炼,获取到key2.新建SpringBoot项目3.工具类4.启动类5.测试类6.测