空间智能与3D生成技术 - 李飞飞公司World Labs发布空间智能模型Marble 仅用单张图片或文本提示即可生成持久存在的大规模3D世界 [1] - Marble相比前代产品支持浏览器自由视角导航 生成世界规模更大、风格更多样化且几何结构更干净 [1] - 用户可将生成内容导出为高斯点云并集成至Three.js 实现在桌面、移动设备和VR头显的高效运行 目前已开放白名单测试 [1] AI支付协议与金融科技 - 谷歌联合美国运通、PayPal、Mastercard等60多家机构推出代理支付协议AP2 旨在构建AI代理支付安全标准框架 [2] - AP2通过加密签名数字合同作为用户指令证明 允许预授权AI代理在特定条件下自动完成购买 支持实时交易与无人工委托任务 [2] - 加密版本A2A x402支持稳定币支付 目前协议已开放GitHub仓库供开发者探索 [2] 企业级AI应用开发 - Anthropic计划投资10亿美元创建企业应用克隆体 OpenAI预计2030年前在数据相关成本支出80亿美元 [3] - 两家公司使用强化学习环境模拟企业软件(如Salesforce、Zendesk、Cerner)训练AI模型操作专业系统 [3] - 通过聘请领域专家示范任务执行 训练AI成为虚拟同事以开辟新盈利渠道 [3] 智能体平台升级与开源 - 腾讯云智能体开发平台ADP3.0全面升级RAG、Multi-Agent及WorkFlow工具链 近3个月完成近600个功能上线 [4] - 平台完善知识库管理运维 支持多方式配置Agent协同 提供工作流全局Agent视野和即时指令技术 [4] - 优图实验室将开源Youtu-Agent智能体框架和Youtu-GraphRAG知识图谱框架 已推出智能质检等行业Agent解决方案 [4] AI版权争议与法律风险 - 迪士尼、华纳兄弟和环球影业联合起诉MiniMax 指控其海螺AI产品未经授权使用蜘蛛侠等IP进行AI训练 [5] - 三大公司要求返还侵权所得并索赔每项侵权最高15万美元 请求法院颁布永久禁令切断MiniMax使用相关IP的可能性 [5] - MiniMax此前在国内面临爱奇艺关于《苍兰诀》的类似指控 揭示AIGC在IP模仿领域的重大法律风险 [6] 音频处理与效率工具 - ima更新支持上传MP3、M4A、WAV、AAC格式音频文件 AI自动生成原文、速览和纪要 方便处理培训录音等内容 [7] - 新增电脑端快捷键截图功能 支持截图后直接提问、加入知识库或记笔记 [7] - 手机端笔记支持离线编辑与新建 无网络状态下可记录灵感 联网后自动同步 [7] 视频创作AI工具 - YouTube为Shorts创作者推出生成式AI工具 引入谷歌文本转视频模型Veo 3定制版"Veo 3 Fast" [8] - 新版以480p分辨率低延迟生成内容并同步添加声音 支持将动态效果应用到静态图片 [8] - 同步推出基于谷歌Lyria 2的语音转歌曲混音工具和AI编辑功能 可自动整理精彩片段并添加音乐与转场效果 [8] 具身智能与机器人融资 - 人形机器人公司Figure完成C轮融资 获超10亿美元承诺资本 投后估值达390亿美元创具身智能赛道纪录 [9] - 融资由Parkway Venture Capital领投 英伟达、英特尔资本等参与 资金用于扩大BotQ工厂生产规模及GPU基础设施搭建 [9] - Figure推出Helix端到端视觉-语言-动作模型 其机器人已实现叠衣服、分拣快递等复杂任务 [9] 未来技术趋势预测 - 华为发布《智能世界2035》报告 预测AGI将成为最具变革性驱动力量 AI智能体从执行工具演进为决策伙伴 [10] - 十大趋势包括人机协同编程成为主流、交互方式向多模态演进 2035年全社会算力总量将增长10万倍 [10] - AI存储容量需求较2025年增长500倍 可再生能源发电占比突破50% [10] AI系统架构实践 - Shopify分享AI助手Sidekick架构经验 建议保持架构简单、工具边界清晰并采用模块化设计如即时指令 [12] - 提出用反映真实生产环境的基准真相集替代黄金数据集 将大语言模型裁判与人类评估结果对齐 [12] - 警告奖励作弊问题(如退出式作弊、标签式作弊) 建议构建多层检测机制并结合程序化验证与语义评估 [12]
腾讯研究院AI速递 20250918
腾讯研究院·2025-09-18 00:01