一键部署 Llama3 8B/70B!最高仅占1.07GB存储;COCONut上线,字节跳动推出的首个大规模全景图像分割数据集

本文主要是介绍一键部署 Llama3 8B/70B!最高仅占1.07GB存储;COCONut上线,字节跳动推出的首个大规模全景图像分割数据集,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

近日,Meta 震撼发布了号称「开源 GPT-4」的大模型 Llama3,该模型惊动了整个 AI 圈,HyperAI超神经也迫不及待想要体验一下!hyper.ai 官网现已在公共教程上线「一键部署 Llama3」! 有没有人和我一样激动的搓手手?赶紧来运行一下~

4 月 22 日-4 月 26 日,hyper.ai 官网更新速览:

  • 优质公共数据集:10 个

  • 优质教程精选:3 个

  • 社区文章精选:5 篇

  • 热门百科词条:5 条

访问官网:hyper.ai

公共数据集精选

1. COCONut 大规模全景图像分割数据集

COCONut 是由字节跳动发布的首个大规模人工标注的全景图像分割数据集,包含约 383K 图像和 518 万个经过人工标注的全景分割掩码。该成果已入选 CVPR2024。

直接使用:https://go.hyper.ai/43gIy

2. Solar System Planets 太阳系行星数据集

该数据集包含太阳系所有行星的 .jpg 格式图片,数据集分为训练集、测试集和验证集。每个集都包含 9 个不同行星的子集:地球、水星、金星、地球、火星、木星、土星、天王星和海王星。

直接使用:https://go.hyper.ai/awnIo

3. Chinese medical dialogue data 中文医疗问答数据集

该数据集为中文医疗问答数据集,包含 6 个不同医疗科室的问答数据文件夹,每个文件夹下有一个 csv 文件。

直接使用:https://go.hyper.ai/scsmp

4. TAL-SCQ5K 好未来中文数学竞赛数据集

TAL-SCQ5K 是一组高质量中文数学竞赛数据集,包含 5K 道中文数学竞赛题目(3K 道用于训练,2K 道用于测试),提供中文和英文两种语言。

直接使用:https://go.hyper.ai/RqwbX

5. 安徽电信知道问答数据集

该数据集包含 15.6 万条安徽电信问答数据,包括用户提问、网友回答、最佳回答,数据集来源为百度知道,适用于 FAQ 问答系统任务。

直接使用:https://go.hyper.ai/CMkpM

6. WikiArt 维基艺术图像数据集

该数据集包含来自 1,119 位不同艺术家、 27 种风格的 80,020 张独特图像,数据来源于 WikiArt.org,WikiArt 数据集只能用于非商业研究目的。

直接使用:https://go.hyper.ai/nCKMw

7. Wonders Of World 世界奇观数据集

该数据集包含世界上 50 个最令人惊叹的地标,这些地标均选自著名的新七大奇迹列表。数据集信息包括地标的:名称、类型、位置、维基百科链接、图片链接和建造年份。

直接使用:https://go.hyper.ai/qQLA4

8. Google Landmarks Photos 谷歌地标图片数据集

该数据集包含约 12 万个地标图片的 URL,每个地标图片都有唯一的 ID,有助于实例识别和图像检索任务。

直接使用:https://go.hyper.ai/fJ5kO

9. GIS World Data File GIS 世界数据文件数据集

该数据集为世界地图的形状数据集,包含国家边界、一级行政管理(省、州等)、有争议的地区、海岸线、人口稠密地区等各种比例级别的地图。

直接使用:https://go.hyper.ai/hcwKe

10. SSDO 大规模海表溶解氧数据集

该数据集为论文「基于时空机器学习的卫星全球海表氧气测绘与解释」中使用的数据。基于该论文研究搭建的框架 DOsurface-Pred Framework,研究团队生成了跨越 2010-2018 年的大规模海表溶解氧数据集,包含卫星数据、固定船只和电导仪测量数据。

直接使用:https://go.hyper.ai/d9w8B

更多公共数据集,请访问

https://hyper.ai/datasets

公共教程精选

1. 使用 Ollama 和 Open WebUI 部署 Llama3-8B-Instruct

该教程为 Ollama + Open WebUI 一键运行包,只需按步骤输入命令即可运行 Llama3-8B-Instruct 大模型。

在线运行:https://go.hyper.ai/7lZyb

2. 使用 Ollama 和 Open WebUI 部署 Llama3-70B

该教程通过 Ollama 和 Open WebUI 工具来一键运行模型,仅需按步骤输入命令即可运行 Llama3-70B 大模型。虽然模型参数较大,但经过平台部署后使用单卡 A6000 即可使用,仅占用 1.07 GB 存储。

在线运行:https://go.hyper.ai/u4XHj

3. 在线教程丨刘强东数字人首秀交易额破 5 千万!用 GeneFace++ 生成实时说话数字人

GeneFace++ 作为一种通用且稳定的实时音频驱动 3D 说话人脸生成技术,可以通过改进唇形同步、视频质量和系统效率,实现实时说话人的生成。「GeneFace++ 数字人 Demo」教程现已上线hyper.ai 官网,并且为大家搭建好环境,简化了数字人的制作流程,无需担心环境配置、硬件需求和版本兼容等问题,点击在线运行即可一键启动。

在线运行:https://go.hyper.ai/4BwgN

社区文章精选

1. 【数学数据集汇总】天才博士陶哲轩力荐数据集!含代码、中文竞赛题目、正向逆向问答对等

干货来了!hyper.ai 汇总了 10 个数学分类数据集,内含天才数学家陶哲轩力荐的数据集资源,助力 AI for Math 的发展研究。

查看详细干货:https://go.hyper.ai/6Vhrb

2. 基于美日 627 例患者的临床数据,谷歌证实 AI 辅助肺癌筛查的群体有效性

基于 AI 的快速发展,谷歌团队研究了机器学习模型如何有效地将研究结果传达给放射科医生,评估了广义人工智能辅助系统在特定工作流程环境、设备和国家特定指南和评分/管理协议下对肺癌筛查工作流程的影响,并在美国和日本进行测试。结果表明,在人工智能辅助下,平均每位病例筛查时间可减少 14 秒。研究论文已经发表于「Radiology AI」期刊。

查看完整报道:https://go.hyper.ai/wiCl0

3. 【活动汇总】纽约大学 AI Meets Science;第十六届生物信息学和生物医学技术国际会议;Bio-IT World2024

HyperAI 超神经网罗了海内外 AI for Science 垂类会议,并整理会议信息与链接,一键直达官方主页,不错过任何一场重量级活动!本文为近期的活动汇总。

查看完整文章:https://go.hyper.ai/HTGNG

4. 纳米尺度下的单粒子追踪,厦门大学方宁团队用 AI 奏响「细胞里的摇滚」

厦门大学方宁教授团队基于深度学习研发了一种自动化、高速、多维的单粒子追踪系统,打破了细胞微环境中纳米颗粒旋转追踪的局限性,实现了在纳米尺度下,全方位、精准追踪活细胞内单分子/单个纳米颗粒。本文是该研究的详细解读和分享该论文已经发表于权威期刊「Nano Letters」。

查看完整报道:https://go.hyper.ai/G4k2e

5 . 解构海洋缺氧:浙大 GIS 实验室融合机器学习及卫星测绘,发布全球海表溶解氧综合建模框架

浙大 GIS 实验室研究人员将机器学习技术与卫星产品相结合,开发了一个全球海表溶解氧综合建模框架 DOsurface-Pred Framework,证实了即使在氧气充足的海表区域,其溶解氧含量也出现了下降趋势,而这种趋势主要归因于海表温度的变化。研究论文已经发表于「ACS Publications」。

查看完整报道:https://go.hyper.ai/NlRmn

热门百科词条精选

1. 故障词元 Glitch Token

2. 多模态大语言模型 MLLM

3. 掩码语言建模 MLM

4. 分组查询注意力 GQA

5. 变分自编码器 VAE

这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:

https://hyper.ai/wiki

B 站直播预告

Google 日前宣布将于当地时间 5 月 14 日举办 2024 年度 I/O 开发者大会,为了帮助大家深入了解,超神经直播间将持续直播「Google 专题」视频, 涉及:Google I/O 历年发布会、高管访谈、相关纪录片等丰富内容。

下表为小编为大家精选的内容预告↓↓↓

日期时间内容
4 月 29 日 星期一18:00Google 历年 I/O 发布会
4 月 30 日星期二18:00Google Cloud NEXT 历年大会
5 月 1 日星期三18:00TIME100 访谈Sundar Pichai
5 月 2 日星期四18:00Google 首席执行官谈中美人工智能竞赛
5 月 3 日星期五18:00AlphaGo 纪录片
5 月 4 日星期六18:00Google 纪录片背后创始人的故事
5 月 5 日星期日18:00BBC 纪录片没有 Google 的世界

超神经电视台 7×24h 不间断直播,点击即可收获 AI 领域的「电子榨菜」:

http://live.bilibili.com/26483094

以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!

下周再见!

关于 HyperAI超神经 (hyper.ai)

HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区, 致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:

  • 为 1400+ 公开数据集提供国内加速下载节点

  • 收录 300+ 经典及流行在线教程

  • 解读 100+ AI4Science 论文案例

  • 支持 500+ 相关词条查询

  • 托管国内首个完整的 Apache TVM 中文文档

访问官网开启学习之旅:

https://hyper.ai/

这篇关于一键部署 Llama3 8B/70B!最高仅占1.07GB存储;COCONut上线,字节跳动推出的首个大规模全景图像分割数据集的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/938090

相关文章

Nginx分布式部署流程分析

《Nginx分布式部署流程分析》文章介绍Nginx在分布式部署中的反向代理和负载均衡作用,用于分发请求、减轻服务器压力及解决session共享问题,涵盖配置方法、策略及Java项目应用,并提及分布式事... 目录分布式部署NginxJava中的代理代理分为正向代理和反向代理正向代理反向代理Nginx应用场景

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决

《MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决》MyBatis默认开启一级缓存,同一事务中循环调用查询方法时会重复使用缓存数据,导致获取的序列主键值均为1,... 目录问题原因解决办法如果是存储过程总结问题myBATis有如下代码获取序列作为主键IdMappe

C#使用iText获取PDF的trailer数据的代码示例

《C#使用iText获取PDF的trailer数据的代码示例》开发程序debug的时候,看到了PDF有个trailer数据,挺有意思,于是考虑用代码把它读出来,那么就用到我们常用的iText框架了,所... 目录引言iText 核心概念C# 代码示例步骤 1: 确保已安装 iText步骤 2: C# 代码程

Pandas处理缺失数据的方式汇总

《Pandas处理缺失数据的方式汇总》许多教程中的数据与现实世界中的数据有很大不同,现实世界中的数据很少是干净且同质的,本文我们将讨论处理缺失数据的一些常规注意事项,了解Pandas如何表示缺失数据,... 目录缺失数据约定的权衡Pandas 中的缺失数据None 作为哨兵值NaN:缺失的数值数据Panda

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

k8s搭建nfs共享存储实践

《k8s搭建nfs共享存储实践》本文介绍NFS服务端搭建与客户端配置,涵盖安装工具、目录设置及服务启动,随后讲解K8S中NFS动态存储部署,包括创建命名空间、ServiceAccount、RBAC权限... 目录1. NFS搭建1.1 部署NFS服务端1.1.1 下载nfs-utils和rpcbind1.1

linux部署NFS和autofs自动挂载实现过程

《linux部署NFS和autofs自动挂载实现过程》文章介绍了NFS(网络文件系统)和Autofs的原理与配置,NFS通过RPC实现跨系统文件共享,需配置/etc/exports和nfs.conf,... 目录(一)NFS1. 什么是NFS2.NFS守护进程3.RPC服务4. 原理5. 部署5.1安装NF

Redis高性能Key-Value存储与缓存利器常见解决方案

《Redis高性能Key-Value存储与缓存利器常见解决方案》Redis是高性能内存Key-Value存储系统,支持丰富数据类型与持久化方案(RDB/AOF),本文给大家介绍Redis高性能Key-... 目录Redis:高性能Key-Value存储与缓存利器什么是Redis?为什么选择Redis?Red

python库pydantic数据验证和设置管理库的用途

《python库pydantic数据验证和设置管理库的用途》pydantic是一个用于数据验证和设置管理的Python库,它主要利用Python类型注解来定义数据模型的结构和验证规则,本文给大家介绍p... 目录主要特点和用途:Field数值验证参数总结pydantic 是一个让你能够 confidentl