【AI大模型】相关知识梳理

2024-09-02 09:20
文章标签 ai 模型 知识 相关 梳理

本文主要是介绍【AI大模型】相关知识梳理,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

为了系统性梳理AI,大模型,训练和推理,数学,机器学习,python等基础知识,并在此基础上深入理解经典论文,本人将持续更新有关这些方向的基础知识博客,博客 将保持一如既往的 通俗易懂的风格。并且结合代码来深入理解。

Transformer

  • 提出背景和原因
  • 与RNN结构相比的优势
  • 基本实现流程
  • Tokenization
  • Position embedding
  • bn,ln和rmsnrom
  • post-norm和pre-norm
  • Self-attention
  • Multi-head attention
  • Residual & ffn
  • Masked attention
  • Cross attention

大模型结构,训练和推理

大模型结构

  • 不同结构的区别(encoder-only,decoder-only,encoder-decoder)
  • Weight tying 及其求导过程
  • 不同数据类型的区别(bf16,fp16,fp32)
  • 大模型参数量的计算

大模型训练

  • 常规训练流程及其区别
  • 大模型训练时显存占用分析
  • 分布式训练-数据并行(DP,DDP,Deepspeed Zero)
  • 分布式训练-张量并行
  • GPU基本原理
  • Flash attention原理
  • 梯度检查点
  • 高效参数微调(以Lora为例)
  • 偏好对齐(以DPO为例)

大模型推理

  • Kv cache
  • mqa,gqa,mla的区别
  • Output 价格比 input价格更贵的原因
  • vllm推理库的原理

经典论文

  • GPT系列
  • llama系列

多模态大模型理解和生成

多模态基础模型

  • Vit
    • 实现方式
    • 位置编码
  • Clip
    • clip的原理
    • siglip与clip的区别

多模态理解

  • blip2
  • Qwenvl
  • Llava
  • Internvl
  • minicpm
  • 大图切分
  • 转接层的实现方式
  • 视觉token压缩

多模态生成

  • 生成模型的发展(ae,vae,ddpm,sd,dit)
  • opensora

机器学习基础和常考面试题目

  • 使用numpy实现神经网络全流程
  • 过拟合
  • 正则化
  • 梯度消失和梯度爆炸
  • 优化器的原理

数学基础和常考面试题目

  • 概率论
  • 线性回归
  • 动态规划

计算机和数据结构基础和常考面试题目

  • 进程和线程
  • 栈和队列
  • 二叉树
  • 图论
  • 排序

Python基础和常考面试题目

  • 深拷贝和浅拷贝,python对应的实现
  • Python gil锁
  • 注册器

这篇关于【AI大模型】相关知识梳理的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1129584

相关文章

CSS3中的字体及相关属性详解

《CSS3中的字体及相关属性详解》:本文主要介绍了CSS3中的字体及相关属性,详细内容请阅读本文,希望能对你有所帮助... 字体网页字体的三个来源:用户机器上安装的字体,放心使用。保存在第三方网站上的字体,例如Typekit和Google,可以link标签链接到你的页面上。保存在你自己Web服务器上的字

详解如何使用Python从零开始构建文本统计模型

《详解如何使用Python从零开始构建文本统计模型》在自然语言处理领域,词汇表构建是文本预处理的关键环节,本文通过Python代码实践,演示如何从原始文本中提取多尺度特征,并通过动态调整机制构建更精确... 目录一、项目背景与核心思想二、核心代码解析1. 数据加载与预处理2. 多尺度字符统计3. 统计结果可

SpringBoot整合Sa-Token实现RBAC权限模型的过程解析

《SpringBoot整合Sa-Token实现RBAC权限模型的过程解析》:本文主要介绍SpringBoot整合Sa-Token实现RBAC权限模型的过程解析,本文给大家介绍的非常详细,对大家的学... 目录前言一、基础概念1.1 RBAC模型核心概念1.2 Sa-Token核心功能1.3 环境准备二、表结

Spring AI 实现 STDIO和SSE MCP Server的过程详解

《SpringAI实现STDIO和SSEMCPServer的过程详解》STDIO方式是基于进程间通信,MCPClient和MCPServer运行在同一主机,主要用于本地集成、命令行工具等场景... 目录Spring AI 实现 STDIO和SSE MCP Server1.新建Spring Boot项目2.a

解决tomcat启动时报Junit相关错误java.lang.ClassNotFoundException: org.junit.Test问题

《解决tomcat启动时报Junit相关错误java.lang.ClassNotFoundException:org.junit.Test问题》:本文主要介绍解决tomcat启动时报Junit相... 目录tomcat启动时报Junit相关错误Java.lang.ClassNotFoundException

Maven中引入 springboot 相关依赖的方式(最新推荐)

《Maven中引入springboot相关依赖的方式(最新推荐)》:本文主要介绍Maven中引入springboot相关依赖的方式(最新推荐),本文给大家介绍的非常详细,对大家的学习或工作具有... 目录Maven中引入 springboot 相关依赖的方式1. 不使用版本管理(不推荐)2、使用版本管理(推

Python的time模块一些常用功能(各种与时间相关的函数)

《Python的time模块一些常用功能(各种与时间相关的函数)》Python的time模块提供了各种与时间相关的函数,包括获取当前时间、处理时间间隔、执行时间测量等,:本文主要介绍Python的... 目录1. 获取当前时间2. 时间格式化3. 延时执行4. 时间戳运算5. 计算代码执行时间6. 转换为指

一文详解Java异常处理你都了解哪些知识

《一文详解Java异常处理你都了解哪些知识》:本文主要介绍Java异常处理的相关资料,包括异常的分类、捕获和处理异常的语法、常见的异常类型以及自定义异常的实现,文中通过代码介绍的非常详细,需要的朋... 目录前言一、什么是异常二、异常的分类2.1 受检异常2.2 非受检异常三、异常处理的语法3.1 try-

Spring Security基于数据库的ABAC属性权限模型实战开发教程

《SpringSecurity基于数据库的ABAC属性权限模型实战开发教程》:本文主要介绍SpringSecurity基于数据库的ABAC属性权限模型实战开发教程,本文给大家介绍的非常详细,对大... 目录1. 前言2. 权限决策依据RBACABAC综合对比3. 数据库表结构说明4. 实战开始5. MyBA

Java的IO模型、Netty原理解析

《Java的IO模型、Netty原理解析》Java的I/O是以流的方式进行数据输入输出的,Java的类库涉及很多领域的IO内容:标准的输入输出,文件的操作、网络上的数据传输流、字符串流、对象流等,这篇... 目录1.什么是IO2.同步与异步、阻塞与非阻塞3.三种IO模型BIO(blocking I/O)NI