使用Java也能开发大模型应用?让我们一探究竟

2024-06-02 18:36

本文主要是介绍使用Java也能开发大模型应用?让我们一探究竟,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

😀由于Python拥有大量的深度学习框架,当前许多大型模型应用和开发框架都是使用Python编程语言实现的。我主要从事Java开发,虽然对Python有些了解,但不多。因此,我很好奇Java是否能像Python一样加载模型并进行开发。经过实际调研,发现这的确可行。
最近,大型模型应用非常火爆,各大公司都在积极推进。有时候,在开发应用时,需要使用大模型或其他AIGC技术,常常需要调用Python服务提供的接口。但是,有些时候,可能功能比较简单轻量,再新建一个Python服务提供接口调用感觉有些过于复杂。因此,我想尝试在Java中实现一些简单的AIGC技术场景。
在这里插入图片描述

前期调研

调研了三个可以在Java中运行深度学习模型的工具,有OpenNLP、ONNXRunTime以及Deeplearning4j。以下是三个工具各自的优缺点:

OpenNLP

简介:
Apache OpenNLP是一个基于机器学习的Java库,用于处理自然语言处理(NLP)任务。它提供了多种NLP工具,包括分词、词性标注、命名实体识别、句法解析等。

优点:

  1. 丰富的功能集:支持多种NLP任务,如分词、词性标注、命名实体识别、句法解析等。
  2. 简单易用:API设计简洁,易于集成到现有的Java项目中。
  3. 可扩展性强:支持用户自定义训练模型,以适应特定需求。
  4. 社区支持:作为Apache基金会的一部分,有良好的文档和社区支持。

缺点:

  1. 性能有限:由于是基于Java实现,某些复杂任务的性能可能不如C++或其他低级语言实现的库。
  2. 模型质量依赖数据:预训练模型的质量取决于训练数据,对于某些特定领域可能需要大量的标注数据来训练高质量模型。
  3. 较少的深度学习支持:主要基于传统的机器学习方法,深度学习支持有限。

ONNX (Open Neural Network Exchange)

简介:
ONNX是一个开放的深度学习模型交换格式,旨在促进不同深度学习框架之间的互操作性。ONNX支持模型的定义和转换,使模型可以在多个框架中运行。

优点:

  1. 框架互操作性:支持从多种深度学习框架(如PyTorch、TensorFlow、Caffe等)导入和导出模型,促进跨框架使用。
  2. 广泛支持:有很多深度学习框架和工具支持ONNX,包括ONNX Runtime,它可以在多个平台上高效运行ONNX模型。
  3. 性能优化:ONNX Runtime通过硬件加速和优化提供高性能推理。

缺点:

  1. 模型转换问题:不同框架间的模型转换可能遇到兼容性问题,需要额外的调试和优化。
  2. 学习曲线:对初学者来说,了解和使用ONNX及其相关工具可能有一定的学习曲线。
  3. 依赖框架更新:框架支持和模型转换工具需要不断更新以跟上深度学习框架的最新版本。

Deeplearning4j

简介:
Deeplearning4j(DL4J)是一个开源的、基于Java和Scala的深度学习框架。它支持分布式训练和GPU加速,适用于大规模的深度学习任务。

优点:

  1. Java生态系统:与Java和Scala生态系统无缝集成,适合需要在JVM上运行深度学习任务的用户。
  2. 分布式训练:支持在Hadoop和Spark等分布式系统上进行大规模训练。
  3. GPU加速:支持CUDA和其他GPU加速,提升模型训练和推理的性能。
  4. 广泛的工具集:包括ND4J(数值计算库)、DataVec(数据预处理库)、Arbiter(超参数优化工具)等。

缺点:

  1. 相对较少的社区支持:相比TensorFlow和PyTorch等流行框架,DL4J的社区和生态系统相对较小。
  2. 复杂性:对于简单的深度学习任务,DL4J的配置和使用可能显得较为复杂。
  3. 文档和教程:尽管有官方文档,但与更主流的框架相比,文档和教程的丰富度和质量还有提升空间。

总结

研究了这三个工具的官方文档,发现OpenNLP这个框架更满足我的需求,而且OpenNLP框架底层在加载深度学习模型时,也是借助了ONNX的能力。Deeplearning4j框架更适合自己使用Java手撕一些经典的深度学习模型,对于当前大模型的支持较弱。

开发&&成果

由于我的使用场景下只有CPU资源,因此为了推理速度,我在huggingface上选择了一个量化的词嵌入(Embedding模型)-nomic-ai/nomic-embed-text-v1,量化后的模型大小只有138M,实测使用AMD的5600GCPU进行推理毫无压力。

代码开发比较简单,核心的部分代码实现如下:

    public double calDistance(String strA, String strB, Integer vecDistanceType) throws OrtException {if (strA == null || strB == null) {throw new IllegalArgumentException("The input parameter cannot be NULL");}File modelFile = new File('下载的词嵌入模型')File vocabFile = new File('下载的模型对应的词汇索引')documentVecDL = new SentenceVectorsDL(entity.getModelFile(), entity.getVocabFile());float[] vecA = documentVecDL.getVectors(strA);float[] vecB = documentVecDL.getVectors(strB);VecDistanceEnum distanceType = VecDistanceEnum.fromType(vecDistanceType);return distanceType.calculate(vecA, vecB);}

完整代码已开源至GitHub,大家觉得有用的话欢迎给个Star。也欢迎大家有时间来我的微信公众号看看。
在这里插入图片描述

参考资料

  1. https://blogsarchive.apache.org/opennlp/entry/accelerate-hugging-face-transformer-models
  2. https://cloudblogs.microsoft.com/opensource/2022/09/20/hugging-face-transformers-now-enabled-in-apache-opennlp-by-onnx-runtime/
  3. https://huggingface.co/nomic-ai/nomic-embed-text-v1
  4. https://github.com/nomic-ai/contrastors

这篇关于使用Java也能开发大模型应用?让我们一探究竟的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1024759

相关文章

使用Python实现IP地址和端口状态检测与监控

《使用Python实现IP地址和端口状态检测与监控》在网络运维和服务器管理中,IP地址和端口的可用性监控是保障业务连续性的基础需求,本文将带你用Python从零打造一个高可用IP监控系统,感兴趣的小伙... 目录概述:为什么需要IP监控系统使用步骤说明1. 环境准备2. 系统部署3. 核心功能配置系统效果展

Java 实用工具类Spring 的 AnnotationUtils详解

《Java实用工具类Spring的AnnotationUtils详解》Spring框架提供了一个强大的注解工具类org.springframework.core.annotation.Annot... 目录前言一、AnnotationUtils 的常用方法二、常见应用场景三、与 JDK 原生注解 API 的

Java controller接口出入参时间序列化转换操作方法(两种)

《Javacontroller接口出入参时间序列化转换操作方法(两种)》:本文主要介绍Javacontroller接口出入参时间序列化转换操作方法,本文给大家列举两种简单方法,感兴趣的朋友一起看... 目录方式一、使用注解方式二、统一配置场景:在controller编写的接口,在前后端交互过程中一般都会涉及

Java中的StringBuilder之如何高效构建字符串

《Java中的StringBuilder之如何高效构建字符串》本文将深入浅出地介绍StringBuilder的使用方法、性能优势以及相关字符串处理技术,结合代码示例帮助读者更好地理解和应用,希望对大家... 目录关键点什么是 StringBuilder?为什么需要 StringBuilder?如何使用 St

使用Java将各种数据写入Excel表格的操作示例

《使用Java将各种数据写入Excel表格的操作示例》在数据处理与管理领域,Excel凭借其强大的功能和广泛的应用,成为了数据存储与展示的重要工具,在Java开发过程中,常常需要将不同类型的数据,本文... 目录前言安装免费Java库1. 写入文本、或数值到 Excel单元格2. 写入数组到 Excel表格

redis中使用lua脚本的原理与基本使用详解

《redis中使用lua脚本的原理与基本使用详解》在Redis中使用Lua脚本可以实现原子性操作、减少网络开销以及提高执行效率,下面小编就来和大家详细介绍一下在redis中使用lua脚本的原理... 目录Redis 执行 Lua 脚本的原理基本使用方法使用EVAL命令执行 Lua 脚本使用EVALSHA命令

Java并发编程之如何优雅关闭钩子Shutdown Hook

《Java并发编程之如何优雅关闭钩子ShutdownHook》这篇文章主要为大家详细介绍了Java如何实现优雅关闭钩子ShutdownHook,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起... 目录关闭钩子简介关闭钩子应用场景数据库连接实战演示使用关闭钩子的注意事项开源框架中的关闭钩子机制1.

Maven中引入 springboot 相关依赖的方式(最新推荐)

《Maven中引入springboot相关依赖的方式(最新推荐)》:本文主要介绍Maven中引入springboot相关依赖的方式(最新推荐),本文给大家介绍的非常详细,对大家的学习或工作具有... 目录Maven中引入 springboot 相关依赖的方式1. 不使用版本管理(不推荐)2、使用版本管理(推

Java 中的 @SneakyThrows 注解使用方法(简化异常处理的利与弊)

《Java中的@SneakyThrows注解使用方法(简化异常处理的利与弊)》为了简化异常处理,Lombok提供了一个强大的注解@SneakyThrows,本文将详细介绍@SneakyThro... 目录1. @SneakyThrows 简介 1.1 什么是 Lombok?2. @SneakyThrows

在 Spring Boot 中实现异常处理最佳实践

《在SpringBoot中实现异常处理最佳实践》本文介绍如何在SpringBoot中实现异常处理,涵盖核心概念、实现方法、与先前查询的集成、性能分析、常见问题和最佳实践,感兴趣的朋友一起看看吧... 目录一、Spring Boot 异常处理的背景与核心概念1.1 为什么需要异常处理?1.2 Spring B