DeepSeek 数学大模型现可一键部署!LongWriter-6k数据集上线,助力大模型万字长文输出

本文主要是介绍DeepSeek 数学大模型现可一键部署!LongWriter-6k数据集上线,助力大模型万字长文输出,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

公共资源速递

This Weekly Snapshots !

5 个数据集:

* LongWriter-6k 长上下文输出数据集

* Yoga-16 人体瑜伽动作图像数据集

* HUST-OBS 甲骨文识别数据集

* UAVDT 无人机目标检测追踪视频数据集

* SWE-bench Verified 代码生成评估基准

1 个模型:

* DeepSeek-Prover-V1.5-RL

3 个教程:

* 一键部署 DeepSeek-Prover-V1.5

* Flash-VStream 视频理解 Demo

* Paints-Undo 一张图生成绘画全过程

访问官网立即使用:openbayes.com

公共数据集

1. LongWriter-6k 长上下文输出数据集

该数据集包含 6k 篇 SFT 数据,输出长度为 2k-32k 字(包括英文和中文),可支持训练 LLM,将其最大输出窗口大小扩展至 10,000+ 字。

* 直接使用:

https://go.openbayes.com/EHvlo

2. Yoga-16 人体瑜伽动作图像数据集

Yoga-16 数据集分为 3 个主要目录:训练、测试和验证,每个目录包含 16 个子目录,对应 16 种不同的瑜伽姿势。这个结构化的数据集提供了全面的图像集合,以方便高级瑜伽姿势识别模型的分类准确率。

* 直接使用:

https://go.openbayes.com/iU957

3. HUST-OBS 甲骨文识别数据集

该数据集包含总计 140,053 幅甲骨文图像,这些图像来自 3 个不同的来源,包括书籍、网站和现有数据库,是迄今为止最大的 OBS 识别和解密数据集之一。

* 直接使用:

https://go.openbayes.com/0hiKT

4. UAVDT 无人机目标检测追踪视频数据集

该数据集包含 10 小时的原始视频,约 8k 个具有代表性的视频帧,这些视频帧带有手动标注边界框和一些有用的标签,例如车辆类别和遮挡。

* 直接使用:

https://go.openbayes.com/lxh5a

5. SWE-bench Verified 代码生成评估基准

该基准是对现有 SWE-bench 的改进版本(子集),旨在更可靠地评估 AI 模型解决现实世界软件问题的能力。

* 直接使用:

https://go.openbayes.com/O1uuo

公共模型

1. DeepSeek-Prover-V1.5-RL

该模型是一个为 Lean 4 定理证明而设计的开源语言模型,它通过优化训练和推理过程来增强 DeepSeek-Prover-V1。该模型在 DeepSeekMath-Base 上进行了预训练,专门研究形式化数学语言,使用从 DeepSeek-Prover-V1 得到的增强形式定理证明数据集进行监督微调。

* 直接使用:

https://go.openbayes.com/XQEtA

公共教程

1. 一键部署 DeepSeek-Prover-V1.5

该模型是 DeepSeek 于 2024 年开源的数学定理证明模型,研究团队在 Lean 4 中引入了该模型,模型通过自我迭代和 Lean 证明器监督,构建了一个「围棋」式的学习环境。该教程是一键部署 DeepSeek-Prover-V1.5 模型,相关环境和依赖已经安装完毕,一键克隆启动即可体验。

* 在线运行:

https://go.openbayes.com/fcH4R

2. Flash-VStream 视频理解 Demo

Flash-VStream 是一种模拟人类记忆机制的视频语言模型。它能够实时处理极长的视频流,并同时响应用户的查询。该教程为 Flash-VStream 一键运行 Demo,只需克隆并启动该容器,直接复制生成的 API 地址,即可对模型进行推理体验。

* 在线运行

https://go.openbayes.com/gxTeU

3. 教程上新 | 仅需 1 张图片即可生成完整绘画过程,Lvmin Zhang 新作 Paints-Undo 上线!

ControlNet 作者张吕敏 (Lvmin Zhang) 开发了名为 Paints-Undo 的新项目,能够快速拆解任意图像的绘画过程,帮助初学者更好地理解不同风格图像的绘画技巧。OpenBayes 现已上线了「Paints-Undo 一张图生成绘画全过程 Demo」,该教程为大家搭建好了环境,无需输入任何命令,一键克隆即可启动!

* 在线运行

https://go.openbayes.com/mTe2p

以上就是小贝上周在 OpenBayes 的全部更新内容啦~

小贝还建立了「Stable Diffusion 教程交流群」,欢迎小伙伴们入群探讨各类技术问题、分享应用效果~扫描下方二维码添加小贝总微信(微信号:OpenBayes001),备注「SD 教程交流」,即可加入群聊。

图片

这篇关于DeepSeek 数学大模型现可一键部署!LongWriter-6k数据集上线,助力大模型万字长文输出的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1109716

相关文章

Nginx分布式部署流程分析

《Nginx分布式部署流程分析》文章介绍Nginx在分布式部署中的反向代理和负载均衡作用,用于分发请求、减轻服务器压力及解决session共享问题,涵盖配置方法、策略及Java项目应用,并提及分布式事... 目录分布式部署NginxJava中的代理代理分为正向代理和反向代理正向代理反向代理Nginx应用场景

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

C#使用iText获取PDF的trailer数据的代码示例

《C#使用iText获取PDF的trailer数据的代码示例》开发程序debug的时候,看到了PDF有个trailer数据,挺有意思,于是考虑用代码把它读出来,那么就用到我们常用的iText框架了,所... 目录引言iText 核心概念C# 代码示例步骤 1: 确保已安装 iText步骤 2: C# 代码程

Pandas处理缺失数据的方式汇总

《Pandas处理缺失数据的方式汇总》许多教程中的数据与现实世界中的数据有很大不同,现实世界中的数据很少是干净且同质的,本文我们将讨论处理缺失数据的一些常规注意事项,了解Pandas如何表示缺失数据,... 目录缺失数据约定的权衡Pandas 中的缺失数据None 作为哨兵值NaN:缺失的数值数据Panda

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

Linux五种IO模型的使用解读

《Linux五种IO模型的使用解读》文章系统解析了Linux的五种IO模型(阻塞、非阻塞、IO复用、信号驱动、异步),重点区分同步与异步IO的本质差异,强调同步由用户发起,异步由内核触发,通过对比各模... 目录1.IO模型简介2.五种IO模型2.1 IO模型分析方法2.2 阻塞IO2.3 非阻塞IO2.4

linux部署NFS和autofs自动挂载实现过程

《linux部署NFS和autofs自动挂载实现过程》文章介绍了NFS(网络文件系统)和Autofs的原理与配置,NFS通过RPC实现跨系统文件共享,需配置/etc/exports和nfs.conf,... 目录(一)NFS1. 什么是NFS2.NFS守护进程3.RPC服务4. 原理5. 部署5.1安装NF

python库pydantic数据验证和设置管理库的用途

《python库pydantic数据验证和设置管理库的用途》pydantic是一个用于数据验证和设置管理的Python库,它主要利用Python类型注解来定义数据模型的结构和验证规则,本文给大家介绍p... 目录主要特点和用途:Field数值验证参数总结pydantic 是一个让你能够 confidentl

JAVA实现亿级千万级数据顺序导出的示例代码

《JAVA实现亿级千万级数据顺序导出的示例代码》本文主要介绍了JAVA实现亿级千万级数据顺序导出的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 前提:主要考虑控制内存占用空间,避免出现同时导出,导致主程序OOM问题。实现思路:A.启用线程池

SpringBoot分段处理List集合多线程批量插入数据方式

《SpringBoot分段处理List集合多线程批量插入数据方式》文章介绍如何处理大数据量List批量插入数据库的优化方案:通过拆分List并分配独立线程处理,结合Spring线程池与异步方法提升效率... 目录项目场景解决方案1.实体类2.Mapper3.spring容器注入线程池bejsan对象4.创建