CS230 Lecture 2深度学习的直观认识(Deep Learning Intuition)

2024-02-17 12:38

本文主要是介绍CS230 Lecture 2深度学习的直观认识(Deep Learning Intuition),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

观看斯坦福大学公开课CS230后记录笔记,以便以后查阅之用。

在这里插入图片描述
使用逻辑回归解决特定目标是否在图片中问题时,对于判断目标是否存在于图片中,对输出的编码可以采用sigmoid函数编码,设置一个阈值,当模型输出大于阈值时,判断存在,反之不存在图中。

在这里插入图片描述

解决一个动物分类问题时,当图片中只有一个动物时,可以使用One-Hot编码,当图片中存在多个动物时,也可以采One-Hot编码,例如[1,1,0],表示图片中存在小狗和小猫。

Deep Learning解决一些问题

在这里插入图片描述

这里解决一个给定一个image判断image是白天还是黑夜的问题。

  1. 数据。估算一下模型的复杂度,这不是一个非常难的分类问题,按照以往的经验大概需要1万张image训练模型,8:2比例划分为训练数据和验证数据集。训练模型的好坏应该以人类的标准衡量模型的分类偏差,例如如果连我们自己都很难分辨一张图片的白天黑夜,那么模型分类错误也就情有可原了。
  2. 输入。输入模型的数据是像素级别的数据。分辨率应该保证分类准确率召回率的条件下,采用越低越好,这样有利于模型的robust。这个很好理解,因为model的input neurons是规定好的,如果遇到分辨率很高的图片可以下采样同样可以达到很好的accuracy和recall,但是如果给定一个分辨率很低的image,而model的input neurons很多,使用分辨率很低的图片上采样会降低model 的 accuracy和recall。
  3. 输出。白天和黑夜输出,采用1表示白天,0表示黑夜。最后一层的输出采用sigmoid函数。
  4. DNN架构。采用一个shallow的network就可以得到一个很好的结果。相反的如果采用一个比较deep的network会使得loss function有很多的local minimum从而导致训练难度增加,还会使得训练的数据量也得增加。
  5. Loss function。这里是一个分类问题,采用采用cross entropy可能会有比较好的结果。

在这里插入图片描述

在这里插入图片描述

解决一个人脸验证的问题:给定你的现在的照片和你的学生卡,学校通过这套系统查看你学生ID在数据库的照片来确认你是否和数据库中的照片是一个人

  1. 使用传统算法遇到的问题。当使用传统算法计算两张照片之间的像素距离(欧式距离等),由于背景不同、穿着打扮不同的原因容易造成分类错误。
  2. 神经网络架构。使用一套在ImageNet等数据集训练好权重的network,去掉最后几层网络,使用当前学校数据库的照片训练model,输出一个向量例如最后一层的output neuron是128个,输出128维向量。进行比对的时候输入该ID的数据库照片model产生一个vector,输入该学生现在的照片输出一个vector,计算这两个vector之间的Distance即可。

在这里插入图片描述

解决一个人脸识别问题,进学校门时由人脸识别系统识别你是本校的学生

  1. 模型架构。训练模型时首先构造一个三元组(Anchor,Positive, Negtive),Anchor代表门口照相机验证时给你拍摄的照片,Positive是你在数据库中真实的照片,Negtive是其他一个人照片,添加Negtive原因是想让模型学习到同一个人和不同人之间的区别。输入模型三元组,模型输出三个向量Enc(A),Enc§,Enc(N),代表三个照片经过模型处理后的encoding。
  2. Loss function。 L = ∣ ∣ E n c ( A ) − E n c ( P ) ∣ ∣ 2 2 − ∣ ∣ E n

这篇关于CS230 Lecture 2深度学习的直观认识(Deep Learning Intuition)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/717779

相关文章

Java中Redisson 的原理深度解析

《Java中Redisson的原理深度解析》Redisson是一个高性能的Redis客户端,它通过将Redis数据结构映射为Java对象和分布式对象,实现了在Java应用中方便地使用Redis,本文... 目录前言一、核心设计理念二、核心架构与通信层1. 基于 Netty 的异步非阻塞通信2. 编解码器三、

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述:HashMap的宏观结构二、核心数据结构解析1. 数组(桶数组)2. 链表节点(Node

Java 虚拟线程的创建与使用深度解析

《Java虚拟线程的创建与使用深度解析》虚拟线程是Java19中以预览特性形式引入,Java21起正式发布的轻量级线程,本文给大家介绍Java虚拟线程的创建与使用,感兴趣的朋友一起看看吧... 目录一、虚拟线程简介1.1 什么是虚拟线程?1.2 为什么需要虚拟线程?二、虚拟线程与平台线程对比代码对比示例:三

Python函数作用域与闭包举例深度解析

《Python函数作用域与闭包举例深度解析》Python函数的作用域规则和闭包是编程中的关键概念,它们决定了变量的访问和生命周期,:本文主要介绍Python函数作用域与闭包的相关资料,文中通过代码... 目录1. 基础作用域访问示例1:访问全局变量示例2:访问外层函数变量2. 闭包基础示例3:简单闭包示例4

深度解析Python中递归下降解析器的原理与实现

《深度解析Python中递归下降解析器的原理与实现》在编译器设计、配置文件处理和数据转换领域,递归下降解析器是最常用且最直观的解析技术,本文将详细介绍递归下降解析器的原理与实现,感兴趣的小伙伴可以跟随... 目录引言:解析器的核心价值一、递归下降解析器基础1.1 核心概念解析1.2 基本架构二、简单算术表达

深度解析Java @Serial 注解及常见错误案例

《深度解析Java@Serial注解及常见错误案例》Java14引入@Serial注解,用于编译时校验序列化成员,替代传统方式解决运行时错误,适用于Serializable类的方法/字段,需注意签... 目录Java @Serial 注解深度解析1. 注解本质2. 核心作用(1) 主要用途(2) 适用位置3

Java MCP 的鉴权深度解析

《JavaMCP的鉴权深度解析》文章介绍JavaMCP鉴权的实现方式,指出客户端可通过queryString、header或env传递鉴权信息,服务器端支持工具单独鉴权、过滤器集中鉴权及启动时鉴权... 目录一、MCP Client 侧(负责传递,比较简单)(1)常见的 mcpServers json 配置

Maven中生命周期深度解析与实战指南

《Maven中生命周期深度解析与实战指南》这篇文章主要为大家详细介绍了Maven生命周期实战指南,包含核心概念、阶段详解、SpringBoot特化场景及企业级实践建议,希望对大家有一定的帮助... 目录一、Maven 生命周期哲学二、default生命周期核心阶段详解(高频使用)三、clean生命周期核心阶

深度剖析SpringBoot日志性能提升的原因与解决

《深度剖析SpringBoot日志性能提升的原因与解决》日志记录本该是辅助工具,却为何成了性能瓶颈,SpringBoot如何用代码彻底破解日志导致的高延迟问题,感兴趣的小伙伴可以跟随小编一起学习一下... 目录前言第一章:日志性能陷阱的底层原理1.1 日志级别的“双刃剑”效应1.2 同步日志的“吞吐量杀手”

Unity新手入门学习殿堂级知识详细讲解(图文)

《Unity新手入门学习殿堂级知识详细讲解(图文)》Unity是一款跨平台游戏引擎,支持2D/3D及VR/AR开发,核心功能模块包括图形、音频、物理等,通过可视化编辑器与脚本扩展实现开发,项目结构含A... 目录入门概述什么是 UnityUnity引擎基础认知编辑器核心操作Unity 编辑器项目模式分类工程