TextCNN文本分类快速上手

2024-02-19 02:20
文章标签 快速 分类 文本 textcnn

本文主要是介绍TextCNN文本分类快速上手,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

这里写目录标题

  • TextCNN介绍:
  • Docker从0安装
  • Docker基于镜像安装
    • 容器打包操作(生成镜像时使用的命令)
    • 安装时命令
  • 页面访问
  • 模型训练
  • API访问
  • 性能测试
  • 其他
    • 查看显卡信息

TextCNN介绍:

1.支持语义识别和分类置信度输出。

2.训练速度快,3000样本在1-3分钟。

3.推理性能佳,5K-10K/秒。

  1. 平均单条推理速度在0.2秒。

  2. 单个模型占用GPU约1.2G,不使用GPU也可以。

Docker从0安装

 docker run --name textcnn_chat --gpus=all --ipc=host --ulimit memlock=-1 \-itd -p 6007:6007 -p 8501:8501 -p 8502:8000 \-v /etc/localtime:/etc/localtime:ro -v ./textcnn-server:/textcnn-server \-d jackyqs/textcnn-server:1.3 

特点:

1.支持语义识别和分类置信度输出。

2.训练速度快,3000样本在1-3分钟。

3.推理性能佳,5K-10K/秒。

4.支持GPU训练,支持异步训练,支持sbert计算分类特征相似度,支持模型训练后重载,支持test/acc, test/recall, test/precision, test/F1输出。(http://localhost:8502)

5.支持类ChatGPT 1-3论对话 streamlit run app.py (http://localhost:8501)

Docker基于镜像安装

容器打包操作(生成镜像时使用的命令)

  • 将安装好、启动好的容器打包成镜像

    docker commit -m='textCNN-server commit' -a='zhangzh' textcnn_chat zzh/textcnn:1.0
    
  • 将镜像,打成可以传到其他地方的tar包

    docker save -o textcnn.tar zzh/textcnn:1.0
    

安装时命令

  • 网盘地址

    ​ 这里因为网盘上传文件有大小限制,所以使用了分卷压缩的方式进行了上传,全部下载下来就可以。

    链接:https://pan.baidu.com/s/1X4vBM8xaoVzrMOKIJVxGRw?pwd=70v8 
    提取码:70v8
    

在这里插入图片描述

  • 将下载好的镜像文件和代码模型文件上传到服务器上,并进行解压,然后在该目录进行操作。

  • 在其他的docker服务器加载镜像

    docker load -i textcnn.tar
    
  • 启动

 docker run --name textcnn_chat --gpus=all --ipc=host --ulimit memlock=-1 \
-itd -p 6007:6007 -p 8501:8501 -p 8502:8000 \-v /etc/localtime:/etc/localtime:ro -v ./textcnn-server:/textcnn-server \-d zzh/textcnn:1.0

特点:

1.支持语义识别和分类置信度输出。

2.训练速度快,3000样本在1-3分钟。

3.推理性能佳,5K-10K/秒。

4.支持GPU训练,支持异步训练,支持sbert计算分类特征相似度,支持模型训练后重载,支持test/acc, test/recall, test/precision, test/F1输出。(http://localhost:8502)

5.支持类ChatGPT 1-3论对话 streamlit run app.py (http://localhost:8501)

页面访问

http://ip:8502/

在这里插入图片描述

模型训练

准备好的训练数据如下:

在这里插入图片描述
tsv文件内容:

微信百万保障	3.285-6.575:您好您是陈国庆本人吗||8.790-15.400:陈先生您好我是微信百万保障中心的话务员给您致电是智能
虚假博彩	3.065-5.055:喂你好||5.060-21.560:您好打扰您一下什么这边是p气的电话客服现在给你致电呢谢谢通知您我们p即将的对应放上限了现在是您费要注册可以领取到平安彩金方便注册领取一下吗||21.560-22.705:l||23.710-25.881:喂能听到吗||25.935-30.176:喂能听到吗

其中,开头表示标签(类型),然后使用\t制表符进行分割,后边跟的是推理出该标签的内容。

每条数据使用\n换行符进行分割。

在这里插入图片描述

API访问

http://ip:8502/predict/ 

在这里插入图片描述

性能测试

6.2/s

在这里插入图片描述

其他

查看显卡信息

lspci | grep -i nvidia

在这里插入图片描述

然后,在该网站搜索版本型号

https://admin.pci-ids.ucw.cz/

在这里插入图片描述

在这里插入图片描述

这篇关于TextCNN文本分类快速上手的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/723209

相关文章

一文详解如何在idea中快速搭建一个Spring Boot项目

《一文详解如何在idea中快速搭建一个SpringBoot项目》IntelliJIDEA作为Java开发者的‌首选IDE‌,深度集成SpringBoot支持,可一键生成项目骨架、智能配置依赖,这篇文... 目录前言1、创建项目名称2、勾选需要的依赖3、在setting中检查maven4、编写数据源5、开启热

苹果macOS 26 Tahoe主题功能大升级:可定制图标/高亮文本/文件夹颜色

《苹果macOS26Tahoe主题功能大升级:可定制图标/高亮文本/文件夹颜色》在整体系统设计方面,macOS26采用了全新的玻璃质感视觉风格,应用于Dock栏、应用图标以及桌面小部件等多个界面... 科技媒体 MACRumors 昨日(6 月 13 日)发布博文,报道称在 macOS 26 Tahoe 中

Python实现精准提取 PDF中的文本,表格与图片

《Python实现精准提取PDF中的文本,表格与图片》在实际的系统开发中,处理PDF文件不仅限于读取整页文本,还有提取文档中的表格数据,图片或特定区域的内容,下面我们来看看如何使用Python实... 目录安装 python 库提取 PDF 文本内容:获取整页文本与指定区域内容获取页面上的所有文本内容获取

详解如何使用Python从零开始构建文本统计模型

《详解如何使用Python从零开始构建文本统计模型》在自然语言处理领域,词汇表构建是文本预处理的关键环节,本文通过Python代码实践,演示如何从原始文本中提取多尺度特征,并通过动态调整机制构建更精确... 目录一、项目背景与核心思想二、核心代码解析1. 数据加载与预处理2. 多尺度字符统计3. 统计结果可

MybatisX快速生成增删改查的方法示例

《MybatisX快速生成增删改查的方法示例》MybatisX是基于IDEA的MyBatis/MyBatis-Plus开发插件,本文主要介绍了MybatisX快速生成增删改查的方法示例,文中通过示例代... 目录1 安装2 基本功能2.1 XML跳转2.2 代码生成2.2.1 生成.xml中的sql语句头2

8种快速易用的Python Matplotlib数据可视化方法汇总(附源码)

《8种快速易用的PythonMatplotlib数据可视化方法汇总(附源码)》你是否曾经面对一堆复杂的数据,却不知道如何让它们变得直观易懂?别慌,Python的Matplotlib库是你数据可视化的... 目录引言1. 折线图(Line Plot)——趋势分析2. 柱状图(Bar Chart)——对比分析3

一文教你Java如何快速构建项目骨架

《一文教你Java如何快速构建项目骨架》在Java项目开发过程中,构建项目骨架是一项繁琐但又基础重要的工作,Java领域有许多代码生成工具可以帮助我们快速完成这一任务,下面就跟随小编一起来了解下... 目录一、代码生成工具概述常用 Java 代码生成工具简介代码生成工具的优势二、使用 MyBATis Gen

使用animation.css库快速实现CSS3旋转动画效果

《使用animation.css库快速实现CSS3旋转动画效果》随着Web技术的不断发展,动画效果已经成为了网页设计中不可或缺的一部分,本文将深入探讨animation.css的工作原理,如何使用以及... 目录1. css3动画技术简介2. animation.css库介绍2.1 animation.cs

SpringBoot快速搭建TCP服务端和客户端全过程

《SpringBoot快速搭建TCP服务端和客户端全过程》:本文主要介绍SpringBoot快速搭建TCP服务端和客户端全过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,... 目录TCPServerTCPClient总结由于工作需要,研究了SpringBoot搭建TCP通信的过程

一文教你Python如何快速精准抓取网页数据

《一文教你Python如何快速精准抓取网页数据》这篇文章主要为大家详细介绍了如何利用Python实现快速精准抓取网页数据,文中的示例代码简洁易懂,具有一定的借鉴价值,有需要的小伙伴可以了解下... 目录1. 准备工作2. 基础爬虫实现3. 高级功能扩展3.1 抓取文章详情3.2 保存数据到文件4. 完整示例