AI技术在词典笔上的应用实践

2024-06-21 07:48

本文主要是介绍AI技术在词典笔上的应用实践,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本文包括以下几个内容

1.扫描和点查
2.离线翻译
3.高性能端侧机器学习计算库EMLL(Edge ML Library)

扫描和点查
扫描识别

扫描识别和常见的字符识别场景不一样
在这里插入图片描述
一秒钟100张图像

算法需要从快速从拍摄的图像中提取文字
在这里插入图片描述
全景拼接

拼接效果对识别影响很大
在这里插入图片描述
全景拼接

像素级检测:对每个像素位置进行文字和背景分类
中心组行:基于分类结果和位置信息,将扫描的中心文字连接并组合成行
矫正切行:将文本行从复杂的背景中切分出来在这里插入图片描述
复杂的应用场景

• 特殊字体,形近字,背景都会干扰识别
在这里插入图片描述
检测模块+识别模块+纠正模块
在这里插入图片描述

超快点查

问题

• 超大广角点查导致广角畸变、光照不均

超快点查

• 根据采集图像预设变换参数

• 将采集图像逆变换得到无畸变图像

• 对阴影进行补偿
在这里插入图片描述

离线翻译

• 离线翻译的需求

• 无网络环境

• 低时延

• 节省带宽

• 隐私

在线翻译模型

• 编码器-解码器架构

• 多个编码器层和解码器层

• 很宽的维度

• 参数量达到上亿规模

在这里插入图片描述

• 神经网络模型存在一定冗余
在这里插入图片描述
• 裁剪模型

• 共享参数

• 量化

• 知识蒸馏

• Lite Transformer

裁剪模型

• 编码器相对更重要

• 更多压缩解码器

• 减少深度的同时减少宽度在这里插入图片描述
共享参数

词向量的共享

在这里插入图片描述

不同层之间的共享
在这里插入图片描述

量化

• 高精度的浮点类型转化为低精度的整型计算
在这里插入图片描述
• 浮点数运算使用量化运算

• 计算量减少,对NPU,DSP芯片友好

• 存储规模减少

• 使用训练感知量化对质量影响也较小

知识蒸馏

• 模型压缩导致质量下降
在这里插入图片描述
• 利用教师模型提升学生模型性能

• 教师模型:大而慢

• 学生模型:小而快
在这里插入图片描述

蒸馏的方法

• Word-level KD

• Sentence-level KD
在这里插入图片描述
高性能端侧机器学习计算库EMLL(Edge ML Library)
端侧AI面临的挑战

• 算力、内存有限

• 功耗限制

• 算法更新

• 多应用部署

端侧AI芯片
端侧AI芯片

• ARM CPU

• 当前端侧AI落地主流平台

• NPU、DSP、GPU

• 受生态环境影响,当前可落地的AI应用较少

• 未来发展趋势

• 端侧AI底层主要耗时计算

• gemm(全连接层、卷积层)

• 扁平矩阵乘

• 第三方blas库gemm针对端侧AI场景下计算性能较差
在这里插入图片描述
EMLL

• EMLL(Edge ML Library)——高性能端侧机器学习计算库

• 为加速端侧AI推理而设计

• 为端侧AI常见的扁平矩阵的计算做了专门的优化

• 支持fp32、fp16、int8等数据类型

• 针对ARM cortex-A7/A35/A53/A55/A76等处理器进行汇编优化

• 支持端侧运行OS:Linux和Android

EMLL优化方法
访存

• 展开外层循环 – 计算/访存比

• 重排元素 – 顺序访存

• 多级分块 – 利用缓存

• 针对扁平矩阵的优化

计算

• SIMD 指令

• 指令顺序

• 指令并发

• 多线程(动态负载)

EMLL功能
• 支持的计算函数

• 支持的架构

• ARMv7a

• ARMv8a

• 支持的端侧OS

• Linux
在这里插入图片描述
EMLL GEMM 性能
在这里插入图片描述
离线NMT量化效果

在这里插入图片描述

这篇关于AI技术在词典笔上的应用实践的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1080623

相关文章

Spring Boot集成/输出/日志级别控制/持久化开发实践

《SpringBoot集成/输出/日志级别控制/持久化开发实践》SpringBoot默认集成Logback,支持灵活日志级别配置(INFO/DEBUG等),输出包含时间戳、级别、类名等信息,并可通过... 目录一、日志概述1.1、Spring Boot日志简介1.2、日志框架与默认配置1.3、日志的核心作用

破茧 JDBC:MyBatis 在 Spring Boot 中的轻量实践指南

《破茧JDBC:MyBatis在SpringBoot中的轻量实践指南》MyBatis是持久层框架,简化JDBC开发,通过接口+XML/注解实现数据访问,动态代理生成实现类,支持增删改查及参数... 目录一、什么是 MyBATis二、 MyBatis 入门2.1、创建项目2.2、配置数据库连接字符串2.3、入

Python标准库之数据压缩和存档的应用详解

《Python标准库之数据压缩和存档的应用详解》在数据处理与存储领域,压缩和存档是提升效率的关键技术,Python标准库提供了一套完整的工具链,下面小编就来和大家简单介绍一下吧... 目录一、核心模块架构与设计哲学二、关键模块深度解析1.tarfile:专业级归档工具2.zipfile:跨平台归档首选3.

使用IDEA部署Docker应用指南分享

《使用IDEA部署Docker应用指南分享》本文介绍了使用IDEA部署Docker应用的四步流程:创建Dockerfile、配置IDEADocker连接、设置运行调试环境、构建运行镜像,并强调需准备本... 目录一、创建 dockerfile 配置文件二、配置 IDEA 的 Docker 连接三、配置 Do

Android Paging 分页加载库使用实践

《AndroidPaging分页加载库使用实践》AndroidPaging库是Jetpack组件的一部分,它提供了一套完整的解决方案来处理大型数据集的分页加载,本文将深入探讨Paging库... 目录前言一、Paging 库概述二、Paging 3 核心组件1. PagingSource2. Pager3.

深入浅出SpringBoot WebSocket构建实时应用全面指南

《深入浅出SpringBootWebSocket构建实时应用全面指南》WebSocket是一种在单个TCP连接上进行全双工通信的协议,这篇文章主要为大家详细介绍了SpringBoot如何集成WebS... 目录前言为什么需要 WebSocketWebSocket 是什么Spring Boot 如何简化 We

Java Stream流之GroupBy的用法及应用场景

《JavaStream流之GroupBy的用法及应用场景》本教程将详细介绍如何在Java中使用Stream流的groupby方法,包括基本用法和一些常见的实际应用场景,感兴趣的朋友一起看看吧... 目录Java Stream流之GroupBy的用法1. 前言2. 基础概念什么是 GroupBy?Stream

python中列表应用和扩展性实用详解

《python中列表应用和扩展性实用详解》文章介绍了Python列表的核心特性:有序数据集合,用[]定义,元素类型可不同,支持迭代、循环、切片,可执行增删改查、排序、推导式及嵌套操作,是常用的数据处理... 目录1、列表定义2、格式3、列表是可迭代对象4、列表的常见操作总结1、列表定义是处理一组有序项目的

C#中的Converter的具体应用

《C#中的Converter的具体应用》C#中的Converter提供了一种灵活的类型转换机制,本文详细介绍了Converter的基本概念、使用场景,具有一定的参考价值,感兴趣的可以了解一下... 目录Converter的基本概念1. Converter委托2. 使用场景布尔型转换示例示例1:简单的字符串到

springboot自定义注解RateLimiter限流注解技术文档详解

《springboot自定义注解RateLimiter限流注解技术文档详解》文章介绍了限流技术的概念、作用及实现方式,通过SpringAOP拦截方法、缓存存储计数器,结合注解、枚举、异常类等核心组件,... 目录什么是限流系统架构核心组件详解1. 限流注解 (@RateLimiter)2. 限流类型枚举 (