20260514 AI 资讯快报
20260514 AI 资讯快报
2026-05-14 · 实时更新
小米具身智能团队开源自动驾驶大模型 Xiaomi OneVL
小米具身智能团队开源一步式潜空间语言视觉推理框架。模型在业内率先实现 VLA、世界模型与潜空间推理的统一,兼具强悍推理能力与高速响应,精度超越显式 CoT,速度对齐潜空间 CoT 方案。在 ROADWork、Impromptu、Alpamayo-R1 等多项基准上达到 SOTA,提供语言与视觉双维度可解释性。
Runway推出AI视频创作智能体Runway Agent
正式推出Runway Agent,对话式AI视频创作智能体。用户仅需描述需求,Agent在单轮对话中完成从概念构思、故事分镜到视觉方向的全流程规划,自动生成包含多场景、配音、对白及配乐的高分辨率成品视频。
豆包输入法推出macOS版本
字节跳动旗下macOS版本正式上线,苹果电脑用户可通过语音实现”用嘴打字”。macOS版本基于豆包App同款语音模型,支持任意输入框实时语音转文字,边说边出字且无时长限制。功能上支持多种方言及中英混说,可智能修正语气词、语病和口误,能记住用户个性化改词习惯等。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Linの博客!
评论
