马斯克称首位受试者可凭思维操控鼠标;字节低调推出视频模型丨 RTE 开发者日报 Vol.148

本文主要是介绍马斯克称首位受试者可凭思维操控鼠标;字节低调推出视频模型丨 RTE 开发者日报 Vol.148,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE (Real Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@CY

01 有话题的新闻

1、马斯克表示第一位 Neuralink 患者可以通过思维控制电脑鼠标

2 月 20 日消息,伊隆·马斯克在社交媒体平台 X 上的 Spaces 活动中透露,脑机接口公司 Neuralink 的首位人类受试者「似乎已完全康复,并能仅凭思维在电脑屏幕上移动鼠标」。

Neuralink 是这位亿万富翁的初创公司,该公司表示已开发出一种大脑植入物,旨在帮助人类利用神经信号来控制外部技术。该公司的目标是恢复视力、运动功能和言语等丧失的能力。

据一篇博客文章称,Neuralink 在 5 月份获得美国食品和药物管理局批准开展这项研究后,于秋季开始招募患者进行首次人体临床试验。此次人体临床试验标志着 Neuralink 在商业化道路上迈出了一步。医疗器械公司必须经过多轮密集的数据安全收集和测试,才能获得 FDA 的最终批准。(@CNBC)

在这里插入图片描述

2、字节跳动低调推出视频模型 Boximator,尚无法作为完善产品落地

2 月 20 日消息,在 OpenAI 发布 Sora 之前,字节跳动低调推出了一款视频模型产品 Boximator。Boximator 可以通过文本控制生成视频中人物或物体的动作。

对此,字节跳动相关人士回应称,Boximator 是视频生成领域控制对象运动的技术方法研究项目,目前还无法作为完善的产品落地,距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。

字节跳动从去年开始布局 AI,并于去年 11 月成立专注于 AI 创新业务的新部门 Flow。一位接近字节跳动的知情人士对界面新闻表示,去年一年,字节跳动创始人张一鸣的全部时间都花在 AI 上了,从其精力分配上也可以看到字节跳动对 AI 业务的重视程度。(@界面新闻)

在这里插入图片描述

3、苹果 AirPods 团队大洗牌:Gary Geaves 卸任,苹果 AirPods 团队换帅

根据外媒报道,长期担任声学副总裁的 Gary Geaves 离职,苹果 AirPods 产品线迎来新的掌舵者 Ruchir Davé。古尔曼在推文中表示使用了“shuffles”(洗牌)来形容,表明苹果公司的音频产品团队管理层出现了较大规模的调整。

据了解,苹果公司的声学小组拥有约 300 名成员,为 AirPods、HomePods 和其他苹果设备开发音频技术。该团队负责创建空间音频,即 AirPods、Vision Pro 和其他设备内置的 3D 音效功能。据去年 12 月报道,当月苹果产品设计副总裁 Tang Tan 离职,而他还负责监督配件设计和开发 AirPods 的声学团队,因此他的离职牵动了苹果硬件业务的连锁反应。(@IT 之家)

4、传言称苹果 Vision Pro 主要人员已被调往可折叠 iPhone 开发团队工作

2 月 20 日消息,早前有传言称,苹果已经停止了可折叠 iPhone 的研发工作,因为显示屏的耐用性存在问题。现在,有最新消息称,这家科技巨头依然正在积极开发这款设备,而且实际上已经重新指派了苹果 Vision Pro 团队的一些关键人员来开发这种新的外形。

一位接近苹果内部计划的人士向 Alpha Biz 透露,该公司正在积极努力推出可折叠 iPhone。这位不愿透露姓名的人士还提供了该产品的预计上市时间表,同时提到苹果 Vision Pro 的主要成员已被指定参与该设备的开发。

「据我所知,大量 Vision Pro 核心人员已经被调往可折叠手机开发团队,用于开发可折叠手机。除非情况有变,否则苹果可折叠手机将于 2026 年 9 月开始销售。」(@cnBeta)

5、谷歌 Gemini Advanced 更新,可直接在线编辑和运行 Python 代码

2 月 20 日消息,根据谷歌官方更新公告,Gemini Advanced 订阅用户可直接在 Gemini 界面中编辑和运行 Python 代码,从而帮助开发者快速验证实验代码,确保代码可预期运行,而且可以立即查看代码修改后的结果。

谷歌于 2 月 8 日宣布将 Bard AI 聊天机器人更名为 Gemini,并推出专门的安卓 App,其中搭载 Gemini Ultra 1.0 模型的版本需要注册 Gemini Advanced 订阅,其在逻辑推理、执行指令、编程和创意协作等方面更胜一筹。此次新功能目前仅适用于 Gemini Advanced 高级用户,Gemini 免费版本不可用。

根据谷歌的说法,这项功能可主要用于以下两方面:一是学习,有志于成为程序员的人可以使用 Gemini 试验代码片段,观察修改的影响,并更深入地理解编码原理。二是验证,开发人员可以使用 Gemini 快速验证 AI 生成的 Python 代码的功能,然后再将其集成到他们的项目中。(@IT 之家)

6、微软发布 Visual Studio 2022 17.10 首个预览版更新:改进 GitHub Copilot、自动安装推荐组件

据微软官方新闻稿,微软目前发布了 Visual Studio 2022 17.10 首个预览版本,该版本号称重点改进了 GitHub Copilot,并对设置、扩展组件等方面进行了一系列更新。微软宣称,GitHub Copilot 在 Visual Studio 2022 17.10 中从“聊天机器人”升级到了“开发伙伴”,在该版本中,Copilot 能够“更好地从项目中收集信息”,进一步为开发者当前的开发环境提供更有意义的答案,同时开发者还能够直接在项目中与 Copilot 互动并获取建议,并“轻松获取生成式 AI 应用开发建议”。(@CSDN)

02 有态度的观点

1、周鸿祎回应 AI 十大预言:已实现 4 个

2 月 20 日,在接受采访时被问到现在怎么看年初提出的 AI 十大预言时,周鸿祎回应称已经实现 4 个了。分别是开源大模型爆发、大模型运行在终端、文生图和文生视频取得突破性进展、多模态成为大模型标配。周鸿祎认为,特别是 Sora 的出现让他感到很意外,发展得很快。

十大预测分别是:大模型无处不在,成为数字系统标配;开源大模型爆发;"小模型"涌现,运行在更多终端;大模型企业级市场崛起,向产业化、垂直化方向发展;Agent 智能体激发大模型潜能,成为超级生产力工具;2024 年是大模型应用场景之年,To C 出现杀手级应用;多模态成为大模型标配;文生图、文生视频等 AIGC 功能突破性增长;具身智能赋能人形机器人产业蓬勃发展;大模型推动基础科学取得突破。(@中国企业家杂志)

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

在这里插入图片描述

素材来源官方媒体/网络新闻

这篇关于马斯克称首位受试者可凭思维操控鼠标;字节低调推出视频模型丨 RTE 开发者日报 Vol.148的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/734231

相关文章

基于Python和MoviePy实现照片管理和视频合成工具

《基于Python和MoviePy实现照片管理和视频合成工具》在这篇博客中,我们将详细剖析一个基于Python的图形界面应用程序,该程序使用wxPython构建用户界面,并结合MoviePy、Pill... 目录引言项目概述代码结构分析1. 导入和依赖2. 主类:PhotoManager初始化方法:__in

Spring Security基于数据库的ABAC属性权限模型实战开发教程

《SpringSecurity基于数据库的ABAC属性权限模型实战开发教程》:本文主要介绍SpringSecurity基于数据库的ABAC属性权限模型实战开发教程,本文给大家介绍的非常详细,对大... 目录1. 前言2. 权限决策依据RBACABAC综合对比3. 数据库表结构说明4. 实战开始5. MyBA

用js控制视频播放进度基本示例代码

《用js控制视频播放进度基本示例代码》写前端的时候,很多的时候是需要支持要网页视频播放的功能,下面这篇文章主要给大家介绍了关于用js控制视频播放进度的相关资料,文中通过代码介绍的非常详细,需要的朋友可... 目录前言html部分:JavaScript部分:注意:总结前言在javascript中控制视频播放

Python基于wxPython和FFmpeg开发一个视频标签工具

《Python基于wxPython和FFmpeg开发一个视频标签工具》在当今数字媒体时代,视频内容的管理和标记变得越来越重要,无论是研究人员需要对实验视频进行时间点标记,还是个人用户希望对家庭视频进行... 目录引言1. 应用概述2. 技术栈分析2.1 核心库和模块2.2 wxpython作为GUI选择的优

Java的IO模型、Netty原理解析

《Java的IO模型、Netty原理解析》Java的I/O是以流的方式进行数据输入输出的,Java的类库涉及很多领域的IO内容:标准的输入输出,文件的操作、网络上的数据传输流、字符串流、对象流等,这篇... 目录1.什么是IO2.同步与异步、阻塞与非阻塞3.三种IO模型BIO(blocking I/O)NI

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》:本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

Oracle存储过程里操作BLOB的字节数据的办法

《Oracle存储过程里操作BLOB的字节数据的办法》该篇文章介绍了如何在Oracle存储过程中操作BLOB的字节数据,作者研究了如何获取BLOB的字节长度、如何使用DBMS_LOB包进行BLOB操作... 目录一、缘由二、办法2.1 基本操作2.2 DBMS_LOB包2.3 字节级操作与RAW数据类型2.

CSS模拟 html 的 title 属性(鼠标悬浮显示提示文字效果)

《CSS模拟html的title属性(鼠标悬浮显示提示文字效果)》:本文主要介绍了如何使用CSS模拟HTML的title属性,通过鼠标悬浮显示提示文字效果,通过设置`.tipBox`和`.tipBox.tipContent`的样式,实现了提示内容的隐藏和显示,详细内容请阅读本文,希望能对你有所帮助... 效

C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)

《C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)》本文主要介绍了C#集成DeepSeek模型实现AI私有化的方法,包括搭建基础环境,如安装Ollama和下载DeepS... 目录前言搭建基础环境1、安装 Ollama2、下载 DeepSeek R1 模型客户端 ChatBo

SpringBoot快速接入OpenAI大模型的方法(JDK8)

《SpringBoot快速接入OpenAI大模型的方法(JDK8)》本文介绍了如何使用AI4J快速接入OpenAI大模型,并展示了如何实现流式与非流式的输出,以及对函数调用的使用,AI4J支持JDK8... 目录使用AI4J快速接入OpenAI大模型介绍AI4J-github快速使用创建SpringBoot