AI加速发展

搜索文档
腾讯研究院AI速递 20250612
腾讯研究院· 2025-06-11 22:31
OpenAI发布推理新模型o3-pro - OpenAI发布推理新模型o3-pro,以推理能力最强、速度最慢为卖点,输入价格20美元/百万tokens,输出80美元/百万tokens [1] - 在科学分析、写作、编程和数据分析领域,o3-pro比o3领先约14%,但在ARC-AGI-2测试中几乎无提升,成本却大幅增加 [1] - 用户测试显示o3-pro擅长复杂推理任务且环境感知能力强,但推理速度极慢,不适合简单问题,主要面向专业用户 [1] Mistral AI发布强推理模型Magistral - Mistral AI发布强推理模型Magistral,包括企业版Medium和开源版Small(24B参数),在AIME2024等多项测试中表现优异 [2] - Magistral通过自主研发的可扩展强化学习流水线实现多语言保真推理,适用于英法西德意阿俄中等语言 [2] - 利用Flash Answers技术,Magistral Medium实现比竞品快10倍的token吞吐量,定价策略更具竞争力(输入2美元/百万token,输出5美元/百万token) [2] Figma推出官方MCP服务 - Figma推出官方MCP服务,直接将设计文件中的变量、组件、布局等信息导入IDE,实现真正的所见即所得,比第三方MCP还原度更高 [3] - 部署简单,只需更新Figma客户端,启用Dev Mode MCP Server,并在支持MCP的编辑器中配置本地服务URL [3] - 使用时只需在Figma中复制设计链接到对话框,一轮交互即可生成高保真页面,无需复杂配置或API申请 [3] Krea AI推出首款原生模型Krea 1 - Krea AI推出首款原生模型Krea 1,专注解决AI图像"同质化"和"塑料感"问题,提供高美学控制力与专业级画质输出 [4] - 该模型支持风格参考和自定义训练,原生支持1.5K分辨率且可扩展至4K,提供实时编辑功能,适用于电商、插画、影视分镜等多种场景 [5] - Krea 1目前提供免费测试版,无需注册或付费即可使用,旨在加速数字艺术创作流程,降低制作成本,有望成为AI图像生成领域的重要参与者 [5] 字节推出豆包大模型1.6系列 - 字节推出豆包大模型1.6系列,包括Seed-1.6综合模型、1.6-thinking强化思考版和1.6-flash极速版,支持256k上下文和多模态推理 [6] - 豆包1.6具备增强推理能力,支持"边想边搜"和DeepResearch功能,多模态理解出色,可进行GUI操作,综合成本降低63% [6] - 同步发布的Seedance 1.0 pro视频生成模型支持多镜头切换和高品质1080P输出 [6] Tolan AI陪伴应用 - Tolan作为外星AI陪伴应用获500万下载量及400万美元ARR,独特之处在于选择"外星人"形象而非模拟人类,强调"非浪漫型、非工具性"陪伴 [7] - 产品设计融合陪伴与游戏化元素,用户可定制外星人伴侣外观,并通过互动发展独特星球环境,形成情感连接,团队特意避免让AI回应过于像人类 [7] - 与国内猫箱等AI陪伴应用相比,Tolan专注普遍"孤独感"而非"恋爱幻想",通过限制聊天时间等机制追求健康使用节奏,因此在用户留存方面表现更好 [7] 理想汽车设立机器人部门 - 理想汽车新设立"空间机器人"和"穿戴机器人"两个二级部门,均隶属于产品部,分别由早期员工帅一帆和张文博负责 [8] - 空间机器人部门与理想"智能空间"战略相关,旨在将车内乘员舱打造为"第三空间",提升车内智能化体验,这已成为公司三大战略之一 [8] - 穿戴机器人部门可能专注于智能眼镜等穿戴设备开发,目标是将"理想同学"AI体验扩展至车机、手机、电脑及眼镜等多终端,实现全场景一致性体验 [8] Figure机器人公司战略 - Figure CEO认为人形机器人是"赢者通吃"行业,目标不是销售硬件而是提供完整"劳动力"系统,强调完全自主运行 [9] - 公司已建立年产1.2万台产线,产品成本较初代降93%,未来四年计划交付10万台,同时面向商业和家庭市场 [9] - Figure采用"共享神经网络"让所有机器人共享学习成果,资金充足,相信最终胜出者将是"最聪明、最便宜"的参与者 [9] Altman未来技术预测 - Altman博文称人类已进入AI加速发展阶段,预测2025年AI胜任认知工作,2027年机器人执行物理任务,2030年人类生产力大幅提升 [10] - 他认为奇点将逐步渗透,AI加速自身研发是最大突破,能提升科学家2-3倍生产力,智能成本终将接近电力成本 [10] - 超级智能发展路径应先解决对齐问题,再使其廉价易得且不过度集中,"廉价到无需计量的智能"将在2030年触手可及 [10] OpenAI Codex团队观点 - OpenAI Codex团队引领软件开发范式从同步"结对编程"转向异步"任务委派",构建能在独立环境中完成整个开发任务的AI代理 [11] - 新版Codex经强化学习微调,注重专业软件工程品质,团队预测开发者角色将从编码者转为审查者和规划者 [11] - 团队认为2025年将是"智能体元年",未来交互界面将融合同步与异步体验,可能演变为类"TikTok"信息流,供开发者快速审批AI工作成果 [11]