【生成式AI】ChatGPT原理解析(1/3)- 对ChatGPT的常见误解

2024-02-26 20:20

本文主要是介绍【生成式AI】ChatGPT原理解析(1/3)- 对ChatGPT的常见误解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Hung-yi Lee 课件整理

文章目录

      • 误解1
      • 误解2
      • ChatGPT真正在做的事情-文字接龙


ChatGPT是在2022年12月7日上线的。
当时试用的感觉十分震撼。

误解1

请添加图片描述
我们想让chatGPT讲个笑话,可能会以为它是在一个笑话的集合里面随机地找一个笑话出来。
我们做一个测试就知道不是这样的了。
请添加图片描述
读完这个笑话,显然不是人讲出来的笑话,是机器生成的。

请添加图片描述
还有这样的,他还要解释一下这个笑话的笑点在哪里。

请添加图片描述
这个笑话更神奇。

这显然不是人想出来的笑话,笑点很奇怪。

误解2

请添加图片描述
当我们问chatGPT “什么是Diffusion Model”的时候,可能会以为它是在网络上搜索了很多相关的文章,然后整理重组出来的。

实际上多数ChatGPT的答案在网络上都找不到一模一样的句子,甚至有很多感觉是幻想出来的。
请添加图片描述
举一个例子,让ChatGPT展示“念能力”的网页,它理解成了念书,而且生成的这些链接都是无效链接,看着像模像样,结果是它幻想出来的。

请添加图片描述
这个是来自OpenAI的官方澄清,讲到ChatGPT是没有联网的,而且信息来自2021年之前,真假需要自己判断。
这句话的意思是它的生成内容不是来源于某一篇特定的文章,是它自己学习到的,自己生成的。

ChatGPT真正在做的事情-文字接龙

请添加图片描述
我们把ChatGPT看作一个函数,它的输入是一个句子,输出这个句子后面应该接的词汇的概率。
但是这样它也只能产生词,而不是句子。
实际上它会把产生的第一个词加到原来的句子后面再重新输入给这个函数,看看这时候概率最大的词是什么,这时候“机”的后面概率最大的可能就是“器”。
然后把“器”作为输入丢给函数,这样反复下去。
在它输出的所有符号里面会有一个代表结束的符号。
当sample出的符号是结束符号,这个回答就结束了。


请添加图片描述
它是怎么考虑过去的历史对话记录呢?
原理是一样的。
同一个对话里面的所有信息都会输入给这个函数,让这个函数决定下一步接哪一个词汇。
这个函数显然十分复杂,可能有1700亿个参数,GPT-3有1700亿个参数,ChatGPT的参数应该不会比它少。

当我们说ChatGPT是语言模型的时候实际上就是在说它是一个文字接龙的模型。


请添加图片描述

接下来要说的是这个神奇又复杂的函数是怎么被找出来的?
我们说它是通过人类老师和网上大量的资料找出来的。
当这个函数被找出来的时候就不需要网络资料了。

这篇关于【生成式AI】ChatGPT原理解析(1/3)- 对ChatGPT的常见误解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/750056

相关文章

python常见环境管理工具超全解析

《python常见环境管理工具超全解析》在Python开发中,管理多个项目及其依赖项通常是一个挑战,下面:本文主要介绍python常见环境管理工具的相关资料,文中通过代码介绍的非常详细,需要的朋友... 目录1. conda2. pip3. uvuv 工具自动创建和管理环境的特点4. setup.py5.

全面解析HTML5中Checkbox标签

《全面解析HTML5中Checkbox标签》Checkbox是HTML5中非常重要的表单元素之一,通过合理使用其属性和样式自定义方法,可以为用户提供丰富多样的交互体验,这篇文章给大家介绍HTML5中C... 在html5中,Checkbox(复选框)是一种常用的表单元素,允许用户在一组选项中选择多个项目。本

Python包管理工具核心指令uvx举例详细解析

《Python包管理工具核心指令uvx举例详细解析》:本文主要介绍Python包管理工具核心指令uvx的相关资料,uvx是uv工具链中用于临时运行Python命令行工具的高效执行器,依托Rust实... 目录一、uvx 的定位与核心功能二、uvx 的典型应用场景三、uvx 与传统工具对比四、uvx 的技术实

Python中使用uv创建环境及原理举例详解

《Python中使用uv创建环境及原理举例详解》uv是Astral团队开发的高性能Python工具,整合包管理、虚拟环境、Python版本控制等功能,:本文主要介绍Python中使用uv创建环境及... 目录一、uv工具简介核心特点:二、安装uv1. 通过pip安装2. 通过脚本安装验证安装:配置镜像源(可

SpringBoot排查和解决JSON解析错误(400 Bad Request)的方法

《SpringBoot排查和解决JSON解析错误(400BadRequest)的方法》在开发SpringBootRESTfulAPI时,客户端与服务端的数据交互通常使用JSON格式,然而,JSON... 目录问题背景1. 问题描述2. 错误分析解决方案1. 手动重新输入jsON2. 使用工具清理JSON3.

java中long的一些常见用法

《java中long的一些常见用法》在Java中,long是一种基本数据类型,用于表示长整型数值,接下来通过本文给大家介绍java中long的一些常见用法,感兴趣的朋友一起看看吧... 在Java中,long是一种基本数据类型,用于表示长整型数值。它的取值范围比int更大,从-922337203685477

Redis过期删除机制与内存淘汰策略的解析指南

《Redis过期删除机制与内存淘汰策略的解析指南》在使用Redis构建缓存系统时,很多开发者只设置了EXPIRE但却忽略了背后Redis的过期删除机制与内存淘汰策略,下面小编就来和大家详细介绍一下... 目录1、简述2、Redis http://www.chinasem.cn的过期删除策略(Key Expir

Go学习记录之runtime包深入解析

《Go学习记录之runtime包深入解析》Go语言runtime包管理运行时环境,涵盖goroutine调度、内存分配、垃圾回收、类型信息等核心功能,:本文主要介绍Go学习记录之runtime包的... 目录前言:一、runtime包内容学习1、作用:① Goroutine和并发控制:② 垃圾回收:③ 栈和

详解Linux中常见环境变量的特点与设置

《详解Linux中常见环境变量的特点与设置》环境变量是操作系统和用户设置的一些动态键值对,为运行的程序提供配置信息,理解环境变量对于系统管理、软件开发都很重要,下面小编就为大家详细介绍一下吧... 目录前言一、环境变量的概念二、常见的环境变量三、环境变量特点及其相关指令3.1 环境变量的全局性3.2、环境变

Java中常见队列举例详解(非线程安全)

《Java中常见队列举例详解(非线程安全)》队列用于模拟队列这种数据结构,队列通常是指先进先出的容器,:本文主要介绍Java中常见队列(非线程安全)的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录一.队列定义 二.常见接口 三.常见实现类3.1 ArrayDeque3.1.1 实现原理3.1.2