【知言】阿里孙佰贵:深度学习十问十答

2024-02-11 06:40

本文主要是介绍【知言】阿里孙佰贵:深度学习十问十答,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

【编者按】深度学习,作为人工智能研究中一个新的领域,其动机在于建立可以模拟人脑进行去分析学习,模仿人脑的逻辑去解释数据的神经网络。为了帮助大家能够更加系统化的学习该门课程,知识库特邀请了CSDN社区专家、知识库特邀编辑孙佰贵精心绘制了深度学习知识图谱。

点击进入深度学习知识库

与此同时,我们还采访了孙佰贵(博客地址:http://blog.csdn.net/sunbaigui)老师,分享他是如何与深度学习结缘以及技术层面的理解与思考。

这里写图片描述

孙佰贵

CSDN:请先简单地介绍一下自己。

孙佰贵:我叫孙佰贵,本科毕业于宁波大学,本科期间曾参加ACM编程竞赛取得最好成绩是省赛银奖,地区赛铜奖。
硕士毕业于浙大CAD&CG国家重点实验室,硕士期间主要研究方向是计算机视觉(图像分割、视频分割、视频2D转3D)。
硕士毕业后来到阿里巴巴工作至今,主要研究和应用方向为深度学习,包括图像分类、图像搜索、广告点击率预测,曾发表一篇ACMMM长文,论文地址http://arxiv.org/abs/1609.06018。在本科大一做ACM编程竞赛开始就坚持着写博客,在csdn上已经陆续写了7、8年。

CSDN:能否分享一下,你是如何与深度学习结缘,并从事这个领域的。

孙佰贵:在本科大三的时候接触到人工智能课程,对里面的手写数字识别尤其感兴趣,当时手写数字识别是用BP(深度学习的基石)网络去做,感觉非常酷。于是打算考研进修,因为觉得人机交互是人工智能普及的必经之路,所以读研期间选择了计算机视觉。

刚入职阿里巴巴工作时也找了图像方向的岗位,当时进到组里的时候,我对组里的各个业务方向还有技术方向都详细研究了下,由于我对人工智能一直有强烈的兴趣所以就选择了当时组里比较新的深度学习方向,然后我当时就成了阿里第二批做深度学习的人,第一批做的人很少,大概就几个,我师兄就是其中一个。

CSDN:在深度学习领域,目前有很多开源的工具和库,开发者该如何选择适合他们的深度学习框架?

孙佰贵:通常一聊到开源,大家首先会看这个开源代码写的性能是否足够好,代码风格是否足够好,支持的特性是否特别前沿。但是往往以上几点都有可能成为误区,一个真正好的开源是要有足够大的开发者人气的,并且它必须是易扩展的,然后还要是易移植的,其实只要有前两点,那这个开源库是一定会不停的更新,这点非常重要,很多开源一时热,但没有开发者基础,往往很容易就冷掉了。

好的开源也要是易移植的,因为工业上用开源的话,一般都会用到线上,这就要求这个开源必须是非常容易移植的,caffe在工业界比较受欢迎。

以上都是基于工业上的需求去选的,一般做学术的话可能会更加要求少量编程,所以一般theano,torch在学术界很受欢迎。

CSDN:如何利用高性能计算加速深度学习算法?

孙佰贵:现在深度学习的加速也是一个非常火热的研究方向,在硬件方面一般采用FPGA或者GPU进行加速,在算法方面一般采用并行计算去加速。

CSDN:目前Intel和Nvidia两家都砸重金押注深度学习,并在处理器、软件栈、生态建设等展开全方位布局,您对此有何评价?

孙佰贵:从商业上来讲,当前这两家在处理器、软件栈、生态建设等方面的布局其实可以看做是一个问题,那就是要卖处理器。早前,Intel专注于CPU,Nvidia专注于GPU分工比较明确,最早Intel在GPU领域有集成显卡,一般情况下也能满足个人的需求,所以导致Nvidia的市场份额一直都不大。近几年工业界在深度学习方面的突飞猛进式的研究与业务拓展,迎来了GPU的高需求期,Nvidia凭借其在GPU独立显卡领域的优势迅速提升了其销售额,也使得Nvidia的市值在最近提升了很多。

从深度学习生态上来讲,Intel在深度学习上的发力,使得工业界之后有更多的选择,也能加速深度学习硬件层面上的突破式创新,对于开发者来讲多了一种选择,这无疑是一种福音。

CSDN:从工程应用角度,您认为一个深度学习平台的易用性和效率哪方面更重要?

孙佰贵:这两者缺一不可,线上的性能效率往往直接决定了该应用能不能上线;然而易用性往往决定了迭代速度;在互联网里,应用的迭代速度与效率都非常重要。

CSDN:目前Google,微软,Facebook,百度分别开源了自己的深度学习平台,形成百花齐放,百家争鸣的局面,您认为哪个更适合初学者,哪个更适合生产部署?

孙佰贵:这三家公司开源的深度学习平台,都带有一些局限性,有些门槛太高,有些专注于某个特定领域,我认为最适合初学者的还是非商业公司的开源,比如caffe,torch等。

从易部署角度来讲,Google的TF比较好。

CSDN:阿里哪些典型业务使用了深度学习,其有效性体现在哪些方面?

孙佰贵:阿里有很多语音,图像,视频相关的都使用了深度学习,有效性在于深度学习在这些方向上的效果都远高于传统算法,这些方向能放大深度学习擅长特征表达学习的优势,因为原先在这些方向上特征的抽取往往都是人工制定的,人工制定的特征存在一个问题,那就是它并不是适用于所有的数据场景的,深度学习可以在任一一个数据场景中学习出专属于这个数据集的特征描述,这是深度学习的优势所在。

CSDN:深度学习理论方面有哪些由于当前技术水平限制还不能用于工程实现?

孙佰贵:由于深度学习强依赖于硬件、集群、大数据,这使得深度学习是少数的工业界成果不输于学术界成果的领域。深度学习是一个重实践的领域,一般情况下,深度学习理论都是在实验上验证过而沉淀下来的,所以往往是先由工程后有理论。

CSDN:技术路线方面,对于DL的入门和进阶,您有什么建议?我们上线了知识库系统化学习的方法,您会怎样应用?

孙佰贵: DL入门的话一般挑一些权威的survey或者书籍,如下作者写的一些资料比较权威:Yoshua Bengio、Geoffrey Hinton、Yann LeCun、Andrew Ng,然后挑一个开源跟着教程去跑例子,比较推荐torch、theano、caffe。

DL进阶的话一定要选择一个开源去做详细的代码解读,比较推荐caffe,然后再去了解各种深度学习相关的领域以及竞赛,再就是一定要去arxiv网站上定期查看DL的相关文章,了解DL最新研究状况与动态。

技术学习一般都是由点及面,上线的知识库可能会很大,除了了解该技术全面的知识点外,还需要挑这里面的某个细分领域去做仔细的研究与学习=>>进入深度学习知识库

推荐阅读:

  • 【知识库专访】亲加CTO郝飞:直播技术架构解密与优化之道
  • CSDN技术主题月深度学习框架 精华集锦
  • 前端开发人员必须了解的七大技能图谱
  • 来吧 主流编程语言图谱+知识库都在这了
  • 主流编程语言图谱+知识库(二)

更多内容请关注CSDN知识库。该产品汇集了领域专家们精心绘制的各重点技术领域的知识图谱,及由特邀编辑(领域专家)从海量数据中层层筛选出的精华内容和资源(学习视频、实践Demo、图书)。知识图谱可以帮助开发者全局把控该技术领域,而精选内容更能让开发者从技术细节加深了解该领域的每个核心技术点。扫描以下二维码,获取更多CSDN知识库内容。

个人知识图谱已上线,快来订制你的专属知识库吧=>>你的个人图谱上线了,快来领取!

这篇关于【知言】阿里孙佰贵:深度学习十问十答的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/699102

相关文章

深度解析Python中递归下降解析器的原理与实现

《深度解析Python中递归下降解析器的原理与实现》在编译器设计、配置文件处理和数据转换领域,递归下降解析器是最常用且最直观的解析技术,本文将详细介绍递归下降解析器的原理与实现,感兴趣的小伙伴可以跟随... 目录引言:解析器的核心价值一、递归下降解析器基础1.1 核心概念解析1.2 基本架构二、简单算术表达

深度解析Java @Serial 注解及常见错误案例

《深度解析Java@Serial注解及常见错误案例》Java14引入@Serial注解,用于编译时校验序列化成员,替代传统方式解决运行时错误,适用于Serializable类的方法/字段,需注意签... 目录Java @Serial 注解深度解析1. 注解本质2. 核心作用(1) 主要用途(2) 适用位置3

Java MCP 的鉴权深度解析

《JavaMCP的鉴权深度解析》文章介绍JavaMCP鉴权的实现方式,指出客户端可通过queryString、header或env传递鉴权信息,服务器端支持工具单独鉴权、过滤器集中鉴权及启动时鉴权... 目录一、MCP Client 侧(负责传递,比较简单)(1)常见的 mcpServers json 配置

Maven中生命周期深度解析与实战指南

《Maven中生命周期深度解析与实战指南》这篇文章主要为大家详细介绍了Maven生命周期实战指南,包含核心概念、阶段详解、SpringBoot特化场景及企业级实践建议,希望对大家有一定的帮助... 目录一、Maven 生命周期哲学二、default生命周期核心阶段详解(高频使用)三、clean生命周期核心阶

深度剖析SpringBoot日志性能提升的原因与解决

《深度剖析SpringBoot日志性能提升的原因与解决》日志记录本该是辅助工具,却为何成了性能瓶颈,SpringBoot如何用代码彻底破解日志导致的高延迟问题,感兴趣的小伙伴可以跟随小编一起学习一下... 目录前言第一章:日志性能陷阱的底层原理1.1 日志级别的“双刃剑”效应1.2 同步日志的“吞吐量杀手”

Unity新手入门学习殿堂级知识详细讲解(图文)

《Unity新手入门学习殿堂级知识详细讲解(图文)》Unity是一款跨平台游戏引擎,支持2D/3D及VR/AR开发,核心功能模块包括图形、音频、物理等,通过可视化编辑器与脚本扩展实现开发,项目结构含A... 目录入门概述什么是 UnityUnity引擎基础认知编辑器核心操作Unity 编辑器项目模式分类工程

深度解析Python yfinance的核心功能和高级用法

《深度解析Pythonyfinance的核心功能和高级用法》yfinance是一个功能强大且易于使用的Python库,用于从YahooFinance获取金融数据,本教程将深入探讨yfinance的核... 目录yfinance 深度解析教程 (python)1. 简介与安装1.1 什么是 yfinance?

Python学习笔记之getattr和hasattr用法示例详解

《Python学习笔记之getattr和hasattr用法示例详解》在Python中,hasattr()、getattr()和setattr()是一组内置函数,用于对对象的属性进行操作和查询,这篇文章... 目录1.getattr用法详解1.1 基本作用1.2 示例1.3 原理2.hasattr用法详解2.

深度解析Spring Security 中的 SecurityFilterChain核心功能

《深度解析SpringSecurity中的SecurityFilterChain核心功能》SecurityFilterChain通过组件化配置、类型安全路径匹配、多链协同三大特性,重构了Spri... 目录Spring Security 中的SecurityFilterChain深度解析一、Security

深度解析Nginx日志分析与499状态码问题解决

《深度解析Nginx日志分析与499状态码问题解决》在Web服务器运维和性能优化过程中,Nginx日志是排查问题的重要依据,本文将围绕Nginx日志分析、499状态码的成因、排查方法及解决方案展开讨论... 目录前言1. Nginx日志基础1.1 Nginx日志存放位置1.2 Nginx日志格式2. 499