Fellou CE

搜索文档
腾讯研究院AI速递 20250911
腾讯研究院· 2025-09-11 00:07
英伟达新一代GPU平台 - 推出专为长上下文推理设计的Rubin CPX GPU 支持一次性在数百万token范围内推理 适用于软件开发与视频生成长上下文任务[1] - 与NVIDIA Vera CPU和Rubin GPU组成Vera Rubin NVL144 CPX平台 单机架提供8 exaflops AI算力 是GB300 NVL72系统的7.5倍[1] - 系统配备100TB高速内存和1.7 PB/s内存带宽 预计2026年底上市[1] Claude文档生成功能升级 - 新增直接创建编辑Excel Word PPT和PDF文件能力 输出真正可用文件格式[2] - 配备私有计算环境 支持代码运行生成文档 具备高级数据分析与跨格式转换功能[2] - 功能已向Max Team和Enterprise用户开放 Pro用户需等待数周 支持导出或保存至Google Drive[2] 腾讯AI编程工具矩阵 - 发布AI CLI工具CodeBuddy Code并开放CodeBuddy IDE公测 国内版支持无限制使用DeepSeek模型[3] - CLI Agent通过自然语言驱动开发运维生命周期 支持多智能体协作与Git/CI/CD深度集成[3] - 内部使用显示编码时间缩短40%以上 AI代码评审贡献从12%增至35%[3] 快手AIGC视频生产系统 - 推出AIGC超级员工Kwali 通过一句话生成完整短视频 自动完成脚本拍摄剪辑到发布全流程[4] - 多Agent框架包含意图解析 脚本生成 镜头匹配和剪辑合成四大模块 接入千寻素材库与数字人模特库[4] - 支持私有素材拖入 所有元素拆分为可独立操控节点 实现实时预览与单独操作[4] Fellou连续体体验系统 - 创建无割裂连续体体验 实现交互连续 任务连续和记忆连续三大特性[5] - 支持跨应用自主执行与动态工作流编排 在Halluminate's Web Bench benchmark测试中取得72%成功率[6] - 推出深度搜索与可视化报告生成核心功能免费开放 引入任务可定时与知识可编辑特性[6] 腾讯开源文生图模型 - 混元图像2.1版本支持原生2K生图 在复杂语义理解与文字生成方面达到业界领先水平[7] - 支持最长1000个tokens提示词 实现多物体分别描述与文字精细控制 覆盖真人漫画等丰富风格[7] - 采用32倍超高压缩倍率VAE 配备双文本编码器 将推理步数由100步蒸馏至8步[7] 谷歌科研软件AI系统 - 结合大语言模型和树搜索算法 自动编写优化科研任务所需软件程序[8] - 作为搜索过程中的变异引擎 整合重组科学文献研究思路形成全新解决方案[8] - 在基因组学 地理空间分析等领域表现突出 解决方案常超越学术界最新研究成果[8] AI平台迁移与交互变革 - Agent趋向微服务化与领域专精 由多Agent组成系统 每个在特定任务成为专家[9] - 专家可获得10倍生产力提升 改变工作性质 解放开发者处理平台琐事[9] - 平台转型改变人与计算交互抽象层 可能出现数千个垂直场景创业机会[9] 马斯克科技项目进展 - Optimus人形机器人将拥有接近人类手部灵巧性 成本约2万美元 难点集中在硬件设计[10] - 特斯拉AI5芯片较AI4实现40倍性能飞跃 年底软件升级使汽车展现意识[10] - 第三代星舰运载能力超100吨 明年有望实现完全可重复使用 预计25年内火星实现自给自足移民[11]