MirageLSD

搜索文档
AI与机器人盘前速递丨优必选拿下人形机器人企业最大采购订单;全球首个直播生成模型发布
每日经济新闻· 2025-07-21 09:23
市场表现 - 科创人工智能ETF华夏(589010)收涨0.39%,持仓股福昕软件领涨4.99%,合合信息上涨4.24%,优刻得、金山办公涨幅超3% [1] - 机器人ETF(562500)收平盘,中大力德领涨5.04%,东杰智能上涨3.74%,巨轮智能、科瑞技术涨幅超2% [1] - 机器人ETF规模增加7.30亿元,最新规模达155.29亿元,份额达177.15亿份,位居可比基金首位 [1] 行业动态 - 优必选科技中标9051.15万元机器人设备采购项目,创全球人形机器人企业最大中标金额纪录 [2] - 优必选发布全球首个支持自主换电的人形机器人Walker S2,计划年内交付500台用于智能制造 [2] - 以色列AI创企Decart推出实时视频生成模型MirageLSD,响应时间小于40毫秒,可应用于游戏、直播、AR/VR等领域 [2] - 上海人工智能实验室发布DeepLink超大规模跨域混训技术方案,支持千公里多智算中心跨域长稳混训千亿参数大模型 [2] 机构观点 - 国产人形机器人产业已升至国家战略,政策支持有望强化,核心部件国产化收窄研发差距 [3] - 国产人形机器人主机厂及代工企业具备长期投资价值,主机厂受益场景渗透,代工企业受益产能扩张 [3]
腾讯研究院AI速递 20250721
腾讯研究院· 2025-07-21 00:02
开源模型竞争 - Kimi K2超越DeepSeek成为全球开源模型第一,总榜排名第五,紧追顶尖闭源模型 [1] - K2继承DeepSeek V3架构并进行参数调整,包括增加专家数量、减半注意力头数、保留第一层Dense及专家无分组 [1] - 全球TOP 10开源模型中唯二入选的均来自中国,"开源=性能弱"的印象正被打破 [1] 视频生成技术突破 - Decart发布MirageLSD,首个实时(40毫秒延迟)、无时长限制的扩散视频模型,可处理任意视频流 [2] - Karpathy成为天使投资人,预见其在实时电影制作、游戏开发和AR领域的广泛应用 [2] - 技术突破在于实时流扩散(LSD)架构,通过逐帧生成和历史增强方法解决误差累积问题 [2] AI音乐创作升级 - Suno V4.5+版本提供人声与器乐分层生成与融合功能,用户可上传个人人声或伴奏进行AI辅助创作 [3] - 新增"Inspire"模式允许用户上传3秒至8分钟的个人干声,AI学习演唱特点后创作符合个人声音气质的音乐 [3] - 谱乐AI平台已同步上线Suno V4.5+核心生成能力,优化创作门槛并提升AI协作效率 [3] 音乐AI助手整合 - 腾讯元宝App 2.30版本正式接入QQ音乐服务,实现"一句话搜歌、划线即播"功能 [4] - 混元大模型与DeepSeek-R1双引擎驱动,能识别模糊音乐描述并结合情境推荐 [4] - 用户体验包括无缝账号体系连接、多模态交互和创作辅助功能 [4] AI Agent竞争 - OpenAI推出ChatGPT agent,面向Pro用户,但遭到Manus、Genspark等竞品公司的直接对比和批评 [5] - ChatGPT agent整合了Deep Research、Operator和ChatGPT功能,能自动完成退休计划、购物清单等任务 [5] - 实测各有特色,Manus输出更美观,Minimax提供多种格式报告,Kimi内容详细且询问用户具体需求 [5] 角色动画技术 - PhysRig是UIUC与Stability AI提出的角色动画可微物理绑定框架,将刚性骨架嵌入弹性软体 [6] - 通过MPM可微分物理模拟替代传统LBS,解决了体积丢失与变形伪影问题 [6] - 在17类角色和120组动画测试中全面优于传统方法,支持跨物种动作迁移 [6] 通用推理模型突破 - OpenAI的神秘通用推理模型在IMO 2025中解出5道题目,获得35分,达到金牌水平 [7] - 该模型具备持续数小时的深度创造性思维能力,远超以往AI的秒级或分钟级推理 [7] - 这是通用强化学习突破而非特定任务训练的成果 [7] AI工具设计理念 - 最佳AI编程工具应是简单、通用的"乐高积木",而非功能堆砌的复杂系统 [8] - Claude Code创造者主张将控制权还给用户,工具不应替你决定工作流,而是提供底层能力 [8] - 有效工作流包括:先探索规划再由用户确认后编码、使用测试驱动开发、对照目标迭代改进 [8] AI产品战略 - 聚焦Agent:预训练模型已含工具知识,只需激发能力,智能上限由模型决定 [9] - 开源:提升知名度、获取社区贡献,防止用技术捷径粉饰效果,倒逼模型真正进步 [9] - 选择DSV3架构:实验证明自研结构无法胜过DSV3,资源有限下避免引入无效变量 [9] AI未来发展方向 - 许多人构建的辅助工具与路由系统最终会被扩展模型取代,真正遵循扩展法则的方向是直接提高模型能力 [10] - 当前AI模型学习数据效率远低于人类,算法改进比简单扩大数据规模更重要 [10] - 多智能体研究新方向:研究如何让模型从15分钟推理扩展到数小时甚至数天,建立AI"文明" [10]
大神Karpathy都投的AI实时视频生成模型:直播都能立即转,无限时长几乎零延迟
量子位· 2025-07-19 13:15
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 大神Karpathy都忍不住投资的AI初创,带来首个实时扩散视频生成! 用扫帚当麦克风,用盒子当混音台,无需昂贵设备就能开一场沉浸式直播。 喜欢游戏类型但不喜欢游戏的画面?简单,实时给它改个风格是不是就舒服多了~ 以上,就是AI初创公司Decart的最新 视频模型 MirageLSD 的演示效果,这是首个实现 零延迟无限实时视频生成 的AI模型。 只要你有想象力,Mirage就能实时生成视频流,为你打造专属的魔法世界~ 输入支持直播、游戏、视频通话、相机拍摄、点播等多种形式,可以说是能转尽转了。 主要是Mirage和其他等待时间很久但只能生成5-10秒视频的模型不一样,它 没有时长限制,延迟还降到了40毫秒 以下,说是零延迟也不为 过吧。 响应速度比之前的模型 快16倍 ,实现了 每秒24帧 的实时视频生成,还允许在视频生成过程中进行持续的提示、转换和编辑。 做到了"你随时想,我随时转"! 于是,AI大神 卡帕西 也出来力挺:实时! 同时他还透露自己也是Decart的天使投资人(非常小)。 在视频生成过程中,由于自回归模型每一帧都依赖于前一帧,一个位置偏移 ...
世界首个「实时、无限」扩散视频生成模型,Karpathy投资站台
机器之心· 2025-07-19 11:13
机器之心报道 但如果加上两个关键词,这将成为 AI 视频生成领域革命性的突破! 就在昨天,Decart 发布了世界上首个 「实时的」「无时长限制的」 并且支持「任意视频流」的扩散视频模型 MirageLSD! 输入任何视频流,无论是相机或视频聊天、电脑屏幕还是游戏,MirageLSD 都能在 40 毫秒延迟 以内 将其转化为你想要的任何世界。 这一切都看上去不可思议,AI 视频已经能够实现和滤镜一样的应用方式,实时智能调整画面风格和画面内容,并且能够通过文本提示任意地进行控制。 实时视频魔法 解锁全新应用可能 前特斯拉 AI 总监,OpenAI 的创始团队成员 Andrej Karpathy 为此技术展开了广泛的想象: 编辑:冷猫 一觉起来世界已经进化成这样了? 每个人都能懂点魔法,能够随意穿梭在各个平行时空和幻想世界里。 读者朋友们看到这说不定撇撇嘴,「这不就是 AI 视频吗?」 1. 将 摄像头画面 变为 "另一个世界"。 2. 自导自演 实时电影 :拿起道具、演绎场景,AI 负责实时布景和风格化,秒看回放,边演边剪。 3. 游戏开发 轻松起步:用简单的球体 / 方块编码游戏机制,再用实时扩散模型为游戏生 ...