DeepSeek 数学大模型现可一键部署!LongWriter-6k数据集上线,助力大模型万字长文输出

本文主要是介绍DeepSeek 数学大模型现可一键部署!LongWriter-6k数据集上线,助力大模型万字长文输出,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

公共资源速递

This Weekly Snapshots !

5 个数据集:

* LongWriter-6k 长上下文输出数据集

* Yoga-16 人体瑜伽动作图像数据集

* HUST-OBS 甲骨文识别数据集

* UAVDT 无人机目标检测追踪视频数据集

* SWE-bench Verified 代码生成评估基准

1 个模型:

* DeepSeek-Prover-V1.5-RL

3 个教程:

* 一键部署 DeepSeek-Prover-V1.5

* Flash-VStream 视频理解 Demo

* Paints-Undo 一张图生成绘画全过程

访问官网立即使用:openbayes.com

公共数据集

1. LongWriter-6k 长上下文输出数据集

该数据集包含 6k 篇 SFT 数据,输出长度为 2k-32k 字(包括英文和中文),可支持训练 LLM,将其最大输出窗口大小扩展至 10,000+ 字。

* 直接使用:

https://go.openbayes.com/EHvlo

2. Yoga-16 人体瑜伽动作图像数据集

Yoga-16 数据集分为 3 个主要目录:训练、测试和验证,每个目录包含 16 个子目录,对应 16 种不同的瑜伽姿势。这个结构化的数据集提供了全面的图像集合,以方便高级瑜伽姿势识别模型的分类准确率。

* 直接使用:

https://go.openbayes.com/iU957

3. HUST-OBS 甲骨文识别数据集

该数据集包含总计 140,053 幅甲骨文图像,这些图像来自 3 个不同的来源,包括书籍、网站和现有数据库,是迄今为止最大的 OBS 识别和解密数据集之一。

* 直接使用:

https://go.openbayes.com/0hiKT

4. UAVDT 无人机目标检测追踪视频数据集

该数据集包含 10 小时的原始视频,约 8k 个具有代表性的视频帧,这些视频帧带有手动标注边界框和一些有用的标签,例如车辆类别和遮挡。

* 直接使用:

https://go.openbayes.com/lxh5a

5. SWE-bench Verified 代码生成评估基准

该基准是对现有 SWE-bench 的改进版本(子集),旨在更可靠地评估 AI 模型解决现实世界软件问题的能力。

* 直接使用:

https://go.openbayes.com/O1uuo

公共模型

1. DeepSeek-Prover-V1.5-RL

该模型是一个为 Lean 4 定理证明而设计的开源语言模型,它通过优化训练和推理过程来增强 DeepSeek-Prover-V1。该模型在 DeepSeekMath-Base 上进行了预训练,专门研究形式化数学语言,使用从 DeepSeek-Prover-V1 得到的增强形式定理证明数据集进行监督微调。

* 直接使用:

https://go.openbayes.com/XQEtA

公共教程

1. 一键部署 DeepSeek-Prover-V1.5

该模型是 DeepSeek 于 2024 年开源的数学定理证明模型,研究团队在 Lean 4 中引入了该模型,模型通过自我迭代和 Lean 证明器监督,构建了一个「围棋」式的学习环境。该教程是一键部署 DeepSeek-Prover-V1.5 模型,相关环境和依赖已经安装完毕,一键克隆启动即可体验。

* 在线运行:

https://go.openbayes.com/fcH4R

2. Flash-VStream 视频理解 Demo

Flash-VStream 是一种模拟人类记忆机制的视频语言模型。它能够实时处理极长的视频流,并同时响应用户的查询。该教程为 Flash-VStream 一键运行 Demo,只需克隆并启动该容器,直接复制生成的 API 地址,即可对模型进行推理体验。

* 在线运行

https://go.openbayes.com/gxTeU

3. 教程上新 | 仅需 1 张图片即可生成完整绘画过程,Lvmin Zhang 新作 Paints-Undo 上线!

ControlNet 作者张吕敏 (Lvmin Zhang) 开发了名为 Paints-Undo 的新项目,能够快速拆解任意图像的绘画过程,帮助初学者更好地理解不同风格图像的绘画技巧。OpenBayes 现已上线了「Paints-Undo 一张图生成绘画全过程 Demo」,该教程为大家搭建好了环境,无需输入任何命令,一键克隆即可启动!

* 在线运行

https://go.openbayes.com/mTe2p

以上就是小贝上周在 OpenBayes 的全部更新内容啦~

小贝还建立了「Stable Diffusion 教程交流群」,欢迎小伙伴们入群探讨各类技术问题、分享应用效果~扫描下方二维码添加小贝总微信(微信号:OpenBayes001),备注「SD 教程交流」,即可加入群聊。

图片

这篇关于DeepSeek 数学大模型现可一键部署!LongWriter-6k数据集上线,助力大模型万字长文输出的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/1109716

相关文章

SQL Server修改数据库名及物理数据文件名操作步骤

《SQLServer修改数据库名及物理数据文件名操作步骤》在SQLServer中重命名数据库是一个常见的操作,但需要确保用户具有足够的权限来执行此操作,:本文主要介绍SQLServer修改数据... 目录一、背景介绍二、操作步骤2.1 设置为单用户模式(断开连接)2.2 修改数据库名称2.3 查找逻辑文件名

canal实现mysql数据同步的详细过程

《canal实现mysql数据同步的详细过程》:本文主要介绍canal实现mysql数据同步的详细过程,本文通过实例图文相结合给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的... 目录1、canal下载2、mysql同步用户创建和授权3、canal admin安装和启动4、canal

使用SpringBoot整合Sharding Sphere实现数据脱敏的示例

《使用SpringBoot整合ShardingSphere实现数据脱敏的示例》ApacheShardingSphere数据脱敏模块,通过SQL拦截与改写实现敏感信息加密存储,解决手动处理繁琐及系统改... 目录痛点一:痛点二:脱敏配置Quick Start——Spring 显示配置:1.引入依赖2.创建脱敏

详解如何使用Python构建从数据到文档的自动化工作流

《详解如何使用Python构建从数据到文档的自动化工作流》这篇文章将通过真实工作场景拆解,为大家展示如何用Python构建自动化工作流,让工具代替人力完成这些数字苦力活,感兴趣的小伙伴可以跟随小编一起... 目录一、Excel处理:从数据搬运工到智能分析师二、PDF处理:文档工厂的智能生产线三、邮件自动化:

Python数据分析与可视化的全面指南(从数据清洗到图表呈现)

《Python数据分析与可视化的全面指南(从数据清洗到图表呈现)》Python是数据分析与可视化领域中最受欢迎的编程语言之一,凭借其丰富的库和工具,Python能够帮助我们快速处理、分析数据并生成高质... 目录一、数据采集与初步探索二、数据清洗的七种武器1. 缺失值处理策略2. 异常值检测与修正3. 数据

pandas实现数据concat拼接的示例代码

《pandas实现数据concat拼接的示例代码》pandas.concat用于合并DataFrame或Series,本文主要介绍了pandas实现数据concat拼接的示例代码,具有一定的参考价值,... 目录语法示例:使用pandas.concat合并数据默认的concat:参数axis=0,join=

C#代码实现解析WTGPS和BD数据

《C#代码实现解析WTGPS和BD数据》在现代的导航与定位应用中,准确解析GPS和北斗(BD)等卫星定位数据至关重要,本文将使用C#语言实现解析WTGPS和BD数据,需要的可以了解下... 目录一、代码结构概览1. 核心解析方法2. 位置信息解析3. 经纬度转换方法4. 日期和时间戳解析5. 辅助方法二、L

使用Python和Matplotlib实现可视化字体轮廓(从路径数据到矢量图形)

《使用Python和Matplotlib实现可视化字体轮廓(从路径数据到矢量图形)》字体设计和矢量图形处理是编程中一个有趣且实用的领域,通过Python的matplotlib库,我们可以轻松将字体轮廓... 目录背景知识字体轮廓的表示实现步骤1. 安装依赖库2. 准备数据3. 解析路径指令4. 绘制图形关键

详解如何使用Python从零开始构建文本统计模型

《详解如何使用Python从零开始构建文本统计模型》在自然语言处理领域,词汇表构建是文本预处理的关键环节,本文通过Python代码实践,演示如何从原始文本中提取多尺度特征,并通过动态调整机制构建更精确... 目录一、项目背景与核心思想二、核心代码解析1. 数据加载与预处理2. 多尺度字符统计3. 统计结果可

解决mysql插入数据锁等待超时报错:Lock wait timeout exceeded;try restarting transaction

《解决mysql插入数据锁等待超时报错:Lockwaittimeoutexceeded;tryrestartingtransaction》:本文主要介绍解决mysql插入数据锁等待超时报... 目录报错信息解决办法1、数据库中执行如下sql2、再到 INNODB_TRX 事务表中查看总结报错信息Lock