机器学习:自督导式学习模型

2023-12-17 14:20
文章标签 学习 模型 机器 督导

本文主要是介绍机器学习:自督导式学习模型,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

outline

在这里插入图片描述

自督导式模型有跨语言的能力

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 中文:DRCD的数据集
  • 英文:SQuAD的数据集
    在104种语言上进行学习,并在英文上进行微调,结果在中文上效果也比较好。
    在这里插入图片描述
    XTREME Benchmark
    只用英文进行微调,在其他剩下的语言中进行测试。
    在这里插入图片描述
    bert可以无视语言的表象,只了解符合背后代表的语义。
    在这里插入图片描述
    看看英文对中文相近的分数算出来,然后取平均值得到MRR,该值越大越好。
    在这里插入图片描述
    在这里插入图片描述
    语言的信息藏在哪里呢?通过embedding展示,相近的词更接近
    在这里插入图片描述
    在这里插入图片描述
    英文转化成向量后,并对其进行偏移向量后,能够重构为中文。
    在这里插入图片描述
    在这里插入图片描述

可以在英文上测试,并在中文上进行测试。中英文上的embedding是有点差距的。

自督导式模型有跨领域的能力

在这里插入图片描述
在这里插入图片描述
把DNA的组成替换成字符型的表示形式进行学习
在这里插入图片描述
用bert有明显的提升。不仅学到了语义信息,也学到了一些通用的能力,在其他领域也能有较好的性能,
在这里插入图片描述
在DNA 蛋白质 音乐上都有所帮助。
在这里插入图片描述
pre-trained模型有强化模型的能力
在这里插入图片描述
跨语言学习的能力用在语音回答系统。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
终极状态:输入是语音,输出也是语音。
在这里插入图片描述
光用hubert是不行的,可以通过中间层后再加几层网络:

在这里插入图片描述
可以把Hubert的输出 丢给文字的预训练Bert
在这里插入图片描述
在这里插入图片描述

在人造的资料上训练Bert

在这里插入图片描述
在这里插入图片描述
通过规则生成一些tokens,并将tokens进行映射,之后再送到网络中进行学习。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • random产生的资料的效果不好
  • pair产生资料的效果还是非常明显的
  • shuffle产生的资料效果还是可以的
    在这里插入图片描述
    token的序列长度是非常重要的。

这篇关于机器学习:自督导式学习模型的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/504700

相关文章

Go学习记录之runtime包深入解析

《Go学习记录之runtime包深入解析》Go语言runtime包管理运行时环境,涵盖goroutine调度、内存分配、垃圾回收、类型信息等核心功能,:本文主要介绍Go学习记录之runtime包的... 目录前言:一、runtime包内容学习1、作用:① Goroutine和并发控制:② 垃圾回收:③ 栈和

Android学习总结之Java和kotlin区别超详细分析

《Android学习总结之Java和kotlin区别超详细分析》Java和Kotlin都是用于Android开发的编程语言,它们各自具有独特的特点和优势,:本文主要介绍Android学习总结之Ja... 目录一、空安全机制真题 1:Kotlin 如何解决 Java 的 NullPointerExceptio

详解如何使用Python从零开始构建文本统计模型

《详解如何使用Python从零开始构建文本统计模型》在自然语言处理领域,词汇表构建是文本预处理的关键环节,本文通过Python代码实践,演示如何从原始文本中提取多尺度特征,并通过动态调整机制构建更精确... 目录一、项目背景与核心思想二、核心代码解析1. 数据加载与预处理2. 多尺度字符统计3. 统计结果可

SpringBoot整合Sa-Token实现RBAC权限模型的过程解析

《SpringBoot整合Sa-Token实现RBAC权限模型的过程解析》:本文主要介绍SpringBoot整合Sa-Token实现RBAC权限模型的过程解析,本文给大家介绍的非常详细,对大家的学... 目录前言一、基础概念1.1 RBAC模型核心概念1.2 Sa-Token核心功能1.3 环境准备二、表结

重新对Java的类加载器的学习方式

《重新对Java的类加载器的学习方式》:本文主要介绍重新对Java的类加载器的学习方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、介绍1.1、简介1.2、符号引用和直接引用1、符号引用2、直接引用3、符号转直接的过程2、加载流程3、类加载的分类3.1、显示

Java学习手册之Filter和Listener使用方法

《Java学习手册之Filter和Listener使用方法》:本文主要介绍Java学习手册之Filter和Listener使用方法的相关资料,Filter是一种拦截器,可以在请求到达Servl... 目录一、Filter(过滤器)1. Filter 的工作原理2. Filter 的配置与使用二、Listen

Spring Security基于数据库的ABAC属性权限模型实战开发教程

《SpringSecurity基于数据库的ABAC属性权限模型实战开发教程》:本文主要介绍SpringSecurity基于数据库的ABAC属性权限模型实战开发教程,本文给大家介绍的非常详细,对大... 目录1. 前言2. 权限决策依据RBACABAC综合对比3. 数据库表结构说明4. 实战开始5. MyBA

Java的IO模型、Netty原理解析

《Java的IO模型、Netty原理解析》Java的I/O是以流的方式进行数据输入输出的,Java的类库涉及很多领域的IO内容:标准的输入输出,文件的操作、网络上的数据传输流、字符串流、对象流等,这篇... 目录1.什么是IO2.同步与异步、阻塞与非阻塞3.三种IO模型BIO(blocking I/O)NI

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》:本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

Java进阶学习之如何开启远程调式

《Java进阶学习之如何开启远程调式》Java开发中的远程调试是一项至关重要的技能,特别是在处理生产环境的问题或者协作开发时,:本文主要介绍Java进阶学习之如何开启远程调式的相关资料,需要的朋友... 目录概述Java远程调试的开启与底层原理开启Java远程调试底层原理JVM参数总结&nbsMbKKXJx