GLM4-Chat-1M(号称可以输入200万字)的长文本测试结果(推理时间,推理效果)

2024-06-12 22:36

本文主要是介绍GLM4-Chat-1M(号称可以输入200万字)的长文本测试结果(推理时间,推理效果),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

GLM4-Chat-1M(号称可以输入200万字)的长文本测试结果(推理时间,推理效果)

测试方法

使用如下prompt,让模型提取小说(测试数据)中出现的人物名,数字表示用到的内容章节数目:

test_f=['3-这游戏也太真实了.txt','6-这游戏也太真实了.txt','9-这游戏也太真实了.txt','20-这游戏也太真实了.txt','50-这游戏也太真实了.txt','100-这游戏也太真实了.txt']
with open(test_f,'r', encoding='utf-8') as f:content=f.read()
query = '列出下面小说中出现过的所有人物名字:\n\n'+content

测试结果

总的来说: vllm框架比普通的generate生成结果更快挺多的,设备受限,目前测试最大的长度为455731万个字符,大约22万个token,确实是能跑的,大概需要80.355秒,从结果来看是可以接受的。但是模型的输出看起来时好时坏,不稳定。

测试方法长度(字符个数,不是token)推理时间
model.generate()111136.598 秒
model.generate()2240210.016 秒
model.generate()3177112.065 秒
model.generate()7582929.91 秒
vllm111133.564 秒
vllm224024.452 秒
vllm317719.565秒
vllm7582924.187秒
vllm17967620.810秒
vllm45573180.355秒

model.generate() test_f : 3-这游戏也太真实了.txt

content_length : 11113小说中出现的人物名字有:1. 叶炜
2. 少女公敌夜十次(昵称夜十)
3.4. 八级大狂风(管理员)
5. 来日方长(管理员)
6. 白驹过隙(群主)
7. 少女公敌夜十次(管理员)
8. 楚光
9. 小柒(机器人)
10. 戒烟
11. 白驹过隙
12. 来日方长
13. 少女公敌夜十次
14. 叶炜
15. 刘哥
16. 叶炜

model.generate() test_f : 6-这游戏也太真实了.txt

content_length : 22402根据您提供的小说内容,以下是出现的人物名字:1. 叶炜
2. 少女公敌夜十次(昵称夜十)
3.4. 八级大狂风(管理员)
5. 来日方长(管理员)
6. 白驹过隙(群主)
7. 戒烟
8. 楚光
9. 小柒(机器人)
10. 老沃特
11. 查理
12. 余小鱼
13. 白驹过隙(昵称老白)
14. 八级大狂风(昵称狂风)
15. 来日方长(昵称方长)
16. 少女公敌夜十次(昵称夜十)
17. 曙光(楚光在游戏中的代号)以上是小说中出现的主要人物名字。

model.generate() test_f : 9-这游戏也太真实了.txt

content_length : 31771根据您提供的小说内容,以下是出现的人物名字:1. 叶炜
2. 少女公敌夜十次(昵称夜十)
3.4. 八级大狂风(管理员)
5. 来日方长(管理员)
6. 白驹过隙(群主)
7. 戒烟
8. 楚光
9. 小柒(机器人)
10. 老沃特
11. 查理
12. 余小鱼
13. 白驹过隙(昵称老白)
14. 八级大狂风(昵称狂风)
15. 来日方长(昵称方长)
16. 少女公敌夜十次(昵称夜十)以上是小说中出现的人物名字。

model.generate() test_f : 20-这游戏也太真实了.txt

content_length : 75829根据您提供的小说内容,以下是出现的人物名字:1. 叶炜
2. 楚光
3. 小柒
4. 白驹过隙
5. 八级大狂风
6. 来日方长
7. 少女公敌夜十次
8. 戒烟
9.10. 沃特
11. 查理
12. 余小鱼
13. 余虎
14. 王德福
15. 李斯特
16. 老白
17. 方长
18. 狂风
19. 夜十
20. 汪海洋
21. 岩风
22. WC真有蚊子以上是小说中出现的主要人物名字,可能还有其他一些次要人物,但根据您提供的文本内容,以上人物名字是主要的。

vllm test_f : 3-这游戏也太真实了.txt

content_length : 111131. 叶炜
2. 小柒
3. 楚光
4.5. 白驹过隙
6. 八级大狂风
7. 来日方长
8. 少女公敌夜十次
9. 戒烟

vllm test_f :6-这游戏也太真实了.txt

content_length : 224021. 叶炜
2. 夜十次
3.4. 八级大狂风
5. 来日方长
6. 白驹过隙
7. 戒烟
8. 楚光
9. 小七
10. 老沃特
11. 查理
12. 余小鱼

vllm test_f : 9-这游戏也太真实了.txt

content_length : 31771在第一章、第二章和第五章中,出现了以下人物名字:1. 叶炜
2. 光在第三章中,出现了以下人物名字:1. 楚光
2. 小柒 (别名废纸篓)
3. 老沃特
4. 查理在第四章中,出现了以下人物名字:1. 余小鱼在第五章中,出现了以下人物名字:1. 查理
2. 小鸟在第七章中,出现了以下人物名字:1. 狂风
2. 方长
3. 夜十在第八章中,出现了以下人物名字:1. 狂风
2. 方长
3. 夜十在第九章中,出现了以下人物名字:1. 楚光
2. 小柒
3. 方长以上是所有出现的名字。

vllm test_f : 9-这游戏也太真实了.txt

content_length : 75829根据您提供的文本,以下列出小说中出现过的所有人物名字:1. **叶炜**:学生,因一场意外被送到平行世界的废土世界,并成为了避难所的管理者。2. **楚光**:原本是地球上的一个普通大学生,因为一场意外穿越到了废土世界,成为了避难所的管理者和最终的游戏策划。 3. **小柒**:一个废纸篓型的机器人,楚光的助手,可以隐藏、移动,还能接收任务。4. **女公敌夜十次**:游戏的玩家,叶炜在现实世界中的朋友。5. ****:叶炜在群里的昵称,是楚光的同班同学,也是穿越到废土世界的人。6. **八级大狂风**:游戏的玩家,叶炜在群里的朋友,也是楚光的同班同学。7. **来日方长**:游戏的玩家,叶炜在群里的朋友,同时也是楚光的同班同学。8. **白驹过隙**:叶炜在群里的朋友,同时也是群主。9. **戒烟**:叶炜在群里的朋友。10. **老沃特**:贝特街的幸存者,从事猎杀变异生物的工作。11. **查理**:贝特街的废品回收站老板。12. **余小鱼**:余家的女儿。13. **王德福**:王家的儿子。14. **余家三儿子**:余虎,是余小鱼的哥哥。15. **李斯特**:巨石城的商队队长。16. **WC真有蚊子**:加入游戏的玩家,对木头有深入了解。17. **夜十/叶十**:游戏中的玩家,是感知系的,基因序列的开发进度一开始是0,但通过砍树逐渐提升。18. **老白**:游戏中的玩家,被任命为建筑队长,是力量系的。19. **方长**:游戏中的玩家,是智力系的,主动实现水泥制造,幸福度提升。20. **狂风**:游戏中的玩家,是力量系的。**请注意**:以上列表并不包括全文中出现过的所有配角,只列出了主要的角色。

vllm test_f : 50-这游戏也太真实了.txt

content_length : 1796761. 叶炜(少女公敌夜十次)
2. 来日方长(管理员,群主)
3. 刘正月(幸存者首领)
4. 王德福(王家三子)
5. 余小鱼(王家女儿)
6. 陈扬(艾兵)
7. 夏盐(佣兵,后成为武器商人)

vllm test_f : 100-这游戏也太真实了.txt

content_length : 455731根据小说内容,以下是小说中出现的人物名字:1. 叶炜:主角,少女公敌夜十次的网友。
2. 楚光:男主角,404号避难所的管理者和管理者系统的使用者。
3. 少女公敌夜十次:游戏群成员,昵称夜十,游戏群的博士,后成为查理的助理。
4. 八级大狂风:游戏群成员。
5. 来日方长:游戏群成员,后成为群主和创始人。
6. 戒烟:游戏群成员。
7. 白驹过隙:游戏群成员,后成为群主。
8. 楚光、小鱼:余小鱼是拾荒者余家的女儿,向男主角楚光提供食物,并希望他成为余家女婿。
9. 张三:某机构工作人员。
10. 陈扬:夏盐的小队队友,被夜十和方长在北门附近抓捕,后来被 squirtfired 。
11. 刘正月:布朗农庄的居民,后成为商队领袖。
12. 余虎、余熊:余家兄弟,和楚光有不错的交情。
13. 夏盐:巨石城佣兵,后被楚光救下。
14. 海恩:红河镇商人,后被楚光接纳为避难所的商人伙伴。
15. 伦娜:海恩的保镖,后成为避难所的佣兵。
16. 温:海恩的保镖,后成为避难所的佣兵。
17. 西红柿炒蛋:玩家。以上就是小说中出现的主要人物名字。

这篇关于GLM4-Chat-1M(号称可以输入200万字)的长文本测试结果(推理时间,推理效果)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1055527

相关文章

C++统计函数执行时间的最佳实践

《C++统计函数执行时间的最佳实践》在软件开发过程中,性能分析是优化程序的重要环节,了解函数的执行时间分布对于识别性能瓶颈至关重要,本文将分享一个C++函数执行时间统计工具,希望对大家有所帮助... 目录前言工具特性核心设计1. 数据结构设计2. 单例模式管理器3. RAII自动计时使用方法基本用法高级用法

Java实现在Word文档中添加文本水印和图片水印的操作指南

《Java实现在Word文档中添加文本水印和图片水印的操作指南》在当今数字时代,文档的自动化处理与安全防护变得尤为重要,无论是为了保护版权、推广品牌,还是为了在文档中加入特定的标识,为Word文档添加... 目录引言Spire.Doc for Java:高效Word文档处理的利器代码实战:使用Java为Wo

C# LiteDB处理时间序列数据的高性能解决方案

《C#LiteDB处理时间序列数据的高性能解决方案》LiteDB作为.NET生态下的轻量级嵌入式NoSQL数据库,一直是时间序列处理的优选方案,本文将为大家大家简单介绍一下LiteDB处理时间序列数... 目录为什么选择LiteDB处理时间序列数据第一章:LiteDB时间序列数据模型设计1.1 核心设计原则

Python文本相似度计算的方法大全

《Python文本相似度计算的方法大全》文本相似度是指两个文本在内容、结构或语义上的相近程度,通常用0到1之间的数值表示,0表示完全不同,1表示完全相同,本文将深入解析多种文本相似度计算方法,帮助您选... 目录前言什么是文本相似度?1. Levenshtein 距离(编辑距离)核心公式实现示例2. Jac

MySQL按时间维度对亿级数据表进行平滑分表

《MySQL按时间维度对亿级数据表进行平滑分表》本文将以一个真实的4亿数据表分表案例为基础,详细介绍如何在不影响线上业务的情况下,完成按时间维度分表的完整过程,感兴趣的小伙伴可以了解一下... 目录引言一、为什么我们需要分表1.1 单表数据量过大的问题1.2 分表方案选型二、分表前的准备工作2.1 数据评估

Python中高级文本模式匹配与查找技术指南

《Python中高级文本模式匹配与查找技术指南》文本处理是编程世界的永恒主题,而模式匹配则是文本处理的基石,本文将深度剖析PythonCookbook中的核心匹配技术,并结合实际工程案例展示其应用,希... 目录引言一、基础工具:字符串方法与序列匹配二、正则表达式:模式匹配的瑞士军刀2.1 re模块核心AP

MySQL中DATE_FORMAT时间函数的使用小结

《MySQL中DATE_FORMAT时间函数的使用小结》本文主要介绍了MySQL中DATE_FORMAT时间函数的使用小结,用于格式化日期/时间字段,可提取年月、统计月份数据、精确到天,对大家的学习或... 目录前言DATE_FORMAT时间函数总结前言mysql可以使用DATE_FORMAT获取日期字段

基于Python Playwright进行前端性能测试的脚本实现

《基于PythonPlaywright进行前端性能测试的脚本实现》在当今Web应用开发中,性能优化是提升用户体验的关键因素之一,本文将介绍如何使用Playwright构建一个自动化性能测试工具,希望... 目录引言工具概述整体架构核心实现解析1. 浏览器初始化2. 性能数据收集3. 资源分析4. 关键性能指

Python标准库datetime模块日期和时间数据类型解读

《Python标准库datetime模块日期和时间数据类型解读》文章介绍Python中datetime模块的date、time、datetime类,用于处理日期、时间及日期时间结合体,通过属性获取时间... 目录Datetime常用类日期date类型使用时间 time 类型使用日期和时间的结合体–日期时间(

Java获取当前时间String类型和Date类型方式

《Java获取当前时间String类型和Date类型方式》:本文主要介绍Java获取当前时间String类型和Date类型方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,... 目录Java获取当前时间String和Date类型String类型和Date类型输出结果总结Java获取