深度学习 --- stanford cs231学习笔记(一)

2024-05-06 19:28

文章标签 学习笔记深度 stanford cs231

本文主要是介绍深度学习 --- stanford cs231学习笔记(一)，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

stanford cs231学习笔记(一)

1，先是讲到了机器学习中的kNN算法，然后因为kNN分类器的一些弊端，引入了线性分类器。

kNN算法的三大弊端：

(1)，计算量大，当特征比较多时表示性差

(2)，训练时耗时少，且计算需求低，反而是对测试数据分类时，计算需求量大。

(3)，衡量两幅图像之间的差异时，衡量方式单一，例如L1,L2距离。且仅有的这两种方法效果都不理想。

2，引入线性分类器

把图像的二维矩阵拉成一长条，变成一个向量x。对每个向量乘以一组权重系数W，得到一个分类的得分。也就是说，如果有10个类别的话，权重矩阵W就有10行。每行的权重系数对应了一个种类，比如说第一行对应的是猫的权重系数，那么第一行乘以x后，得到的值就是猫的得分。第二行是人，第二行乘以x后，就能得到对人的打分。依此类推，最终会得到10类的打分。

上图为一个简化模型，假设图像只有4个像素，且总共只有3个类别的打分结果。可以看得出，这个打分结果是错误的，Dog的得分最高。而cat反而得了最低分。

3，如何选择正确的W，才能让相应类别的图像打分最高而在其他类型的图像上打分低？答案就是损失函数Loss function，用于衡量正对当前所使用的W矩阵分类的打分结果，有多么的unhappy不满意。

3，1，损失函数有两种，一种是SVM loss（也叫hinge loss），分数越高表示越unhappy，即越不满意。

其中 $s_{j}$ 和 $s_{y_{i}}$ 表示经过Wx计算后的分数向量score vector，根据这种方式计算后得到的结果分别是：

最终得到L函数的均值，对svm loss而言，分数越高，说明分类结果越不好。

3，2，另一种损失函数叫softmax（也叫cross-entropy loss），他把分数转化成了概率函数，然后再对这个概率函数求了一个负自然对数。

负自然对数函数的图像如下图所示，又因为概率函数的值域在0~1之间，因此，最终L函数的值域应该是在正无穷大到0之间。概率越低损失函数越大，概率越大，也就是越接近1，损失函数的值越接近0。

4，Loss function用于如何评估权重W的合理性，相当于是一个“体检指标”。指标高了，说明W有病了，如果指标越低，则说明W越健康。如何有效的利用Loss函数去优化W呢？这时optimization就出现了，也叫优化函数。

既然，我们的目标是让损失函数L最小化，我们就应该试着找到怎么改变W才能让L减小的最多。这里用到了求极限的概念，也就是通过让W增加一个很小的变化h，然后观察L值的变化。

5，改变W后L的变化有可能变大，也有可能变小。而我们的目的是希望找到让L减小最快的W。这时，就引出了optimization优化。

常见的优化方式是梯度下降法，梯度下降法的原理是源于函数f在点P处的梯度一定是函数f在P点处的所有方向导数中增加最大的方向导数。因此，我们要想让函数f减小的最多，我们只需让自变量x沿着这一方向变化即可。

6，为了防止过拟合，在Loss函数中还可以加入Regularization正则化函数。

他能够使得拟合出来的函数尽可能的简单。

（全文完）

--- 作者，松下J27

参考文献(鸣谢)：

1，Stanford University CS231n: Deep Learning for Computer Vision

2，https://zh.wikipedia.org/wiki/%E6%A2%AF%E5%BA%A6%E4%B8%8B%E9%99%8D%E6%B3%95

版权声明：所有的笔记，可能来自很多不同的网站和说明，在此没法一一列出，如有侵权，请告知，立即删除。欢迎大家转载，但是，如果有人引用或者COPY我的文章，必须在你的文章中注明你所使用的图片或者文字来自于我的文章，否则，侵权必究。 ----松下J27

这篇关于深度学习 --- stanford cs231学习笔记(一)的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/965164。 23002807@qq.com

相关文章

Java中Redisson 的原理深度解析

Java中Redisson 的原理深度解析

《Java中Redisson的原理深度解析》Redisson是一个高性能的Redis客户端,它通过将Redis数据结构映射为Java对象和分布式对象,实现了在Java应用中方便地使用Redis,本文... 目录前言一、核心设计理念二、核心架构与通信层1. 基于 Netty 的异步非阻塞通信2. 编解码器三、

阅读更多...

Java HashMap的底层实现原理深度解析

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述：HashMap的宏观结构二、核心数据结构解析1. 数组（桶数组）2. 链表节点（Node

阅读更多...

Java 虚拟线程的创建与使用深度解析

Java 虚拟线程的创建与使用深度解析

《Java虚拟线程的创建与使用深度解析》虚拟线程是Java19中以预览特性形式引入,Java21起正式发布的轻量级线程,本文给大家介绍Java虚拟线程的创建与使用,感兴趣的朋友一起看看吧... 目录一、虚拟线程简介1.1 什么是虚拟线程？1.2 为什么需要虚拟线程？二、虚拟线程与平台线程对比代码对比示例：三

阅读更多...

Python函数作用域与闭包举例深度解析

Python函数作用域与闭包举例深度解析

《Python函数作用域与闭包举例深度解析》Python函数的作用域规则和闭包是编程中的关键概念,它们决定了变量的访问和生命周期,：本文主要介绍Python函数作用域与闭包的相关资料,文中通过代码... 目录1. 基础作用域访问示例1：访问全局变量示例2：访问外层函数变量2. 闭包基础示例3：简单闭包示例4

阅读更多...

深度解析Python中递归下降解析器的原理与实现

深度解析Python中递归下降解析器的原理与实现

《深度解析Python中递归下降解析器的原理与实现》在编译器设计、配置文件处理和数据转换领域,递归下降解析器是最常用且最直观的解析技术,本文将详细介绍递归下降解析器的原理与实现,感兴趣的小伙伴可以跟随... 目录引言：解析器的核心价值一、递归下降解析器基础1.1 核心概念解析1.2 基本架构二、简单算术表达

阅读更多...

深度解析Java @Serial 注解及常见错误案例

深度解析Java @Serial 注解及常见错误案例

《深度解析Java@Serial注解及常见错误案例》Java14引入@Serial注解,用于编译时校验序列化成员,替代传统方式解决运行时错误,适用于Serializable类的方法/字段,需注意签... 目录Java @Serial 注解深度解析1. 注解本质2. 核心作用(1) 主要用途(2) 适用位置3

阅读更多...

Java MCP 的鉴权深度解析

Java MCP 的鉴权深度解析

《JavaMCP的鉴权深度解析》文章介绍JavaMCP鉴权的实现方式,指出客户端可通过queryString、header或env传递鉴权信息,服务器端支持工具单独鉴权、过滤器集中鉴权及启动时鉴权... 目录一、MCP Client 侧（负责传递，比较简单）（1）常见的 mcpServers json 配置

阅读更多...

Maven中生命周期深度解析与实战指南

Maven中生命周期深度解析与实战指南

《Maven中生命周期深度解析与实战指南》这篇文章主要为大家详细介绍了Maven生命周期实战指南,包含核心概念、阶段详解、SpringBoot特化场景及企业级实践建议,希望对大家有一定的帮助... 目录一、Maven 生命周期哲学二、default生命周期核心阶段详解（高频使用）三、clean生命周期核心阶

阅读更多...

深度剖析SpringBoot日志性能提升的原因与解决

深度剖析SpringBoot日志性能提升的原因与解决

《深度剖析SpringBoot日志性能提升的原因与解决》日志记录本该是辅助工具,却为何成了性能瓶颈,SpringBoot如何用代码彻底破解日志导致的高延迟问题,感兴趣的小伙伴可以跟随小编一起学习一下... 目录前言第一章：日志性能陷阱的底层原理1.1 日志级别的“双刃剑”效应1.2 同步日志的“吞吐量杀手”

阅读更多...

Unity新手入门学习殿堂级知识详细讲解（图文）

Unity新手入门学习殿堂级知识详细讲解（图文）

《Unity新手入门学习殿堂级知识详细讲解（图文）》Unity是一款跨平台游戏引擎,支持2D/3D及VR/AR开发,核心功能模块包括图形、音频、物理等,通过可视化编辑器与脚本扩展实现开发,项目结构含A... 目录入门概述什么是 UnityUnity引擎基础认知编辑器核心操作Unity 编辑器项目模式分类工程

阅读更多...