AI递归自我改进
搜索文档
腾讯研究院AI速递 20260313
腾讯研究院· 2026-03-13 00:01
AI行业重大并购与战略布局 - 谷歌以320亿美元全现金完成对以色列云安全公司Wiz的收购,为其史上最大交易,较2024年初报价溢价近40% [1] - 此次收购核心逻辑是AI时代云攻击面扩大,谷歌计划联合此前收购的Mandiant打造“统一安全平台”,并将Gemini嵌入威胁情报排序 [1] - 英伟达披露未来五年将投入260亿美元构建开源AI模型,旨在通过开源生态绑定开发者至自家技术底座 [2] AI模型与开源技术进展 - 英伟达发布并开源120B参数MoE模型Nemotron 3 Super,采用混合Mamba-Transformer架构,原生支持100万token上下文,PinchBench得分85.6%登顶开源榜首 [2] - 该模型采用NVFP4格式预训练,适配Blackwell架构,B200芯片推理速度达H100的4倍,吞吐量为上代5倍以上 [2] - 阶跃星辰推出StepClaw,基于OpenClaw打造云端AI助手,提供5万个免费体验名额,包含5000万模型Tokens及云服务器资源 [5][6] AI企业应用与生产力工具 - Anthropic发布Claude for Excel和PowerPoint重大更新,实现跨文件全上下文共享,单一对话可同时操控多个工作簿和幻灯片 [3] - 新增“技能”功能将复杂业务流程转化为一键操作,预置财务审计、DCF模板、PPT润色等专业技能,支持企业自定义复用 [3] - 腾讯自研AI智能体WorkBuddy更新,支持微信扫码一键直连,并正式支持自动化定时任务,可定期生成日报周报、抓取竞品信息 [4] AI生成式内容与3D资产 - VAST发布Tripo P1.0模型,2秒内可生成拓扑规整、500至20000面的游戏级3D网格资产,效率较现有方案提升百倍以上 [7] - 该模型在原生三维空间中进行概率生成,顶点、边、面统一建模全局演化,生成资产可直接进入游戏引擎、仿真模拟和实时渲染流程 [7] AI行业趋势与市场洞察 - a16z最新Top 100 AI应用报告显示ChatGPT周活仅占全球人口10%,市场仍处早期,并指出记忆功能将成为AI产品核心优势 [8] - ChatGPT、Claude、Gemini三大平台定位分化明显,Claude深耕专业工作流,ChatGPT瞄准大众消费,Gemini侧重创意工具和存量用户转化 [8] - Ramp最新AI指数显示Anthropic已超越OpenAI成为美国企业首选,在产品性能和价格均非最优的情况下需求仍持续增长 [3] AI前沿研究与未来预测 - Anthropic内部研究人员透露已观察到AI递归自我改进的早期迹象,70%至90%的模型开发代码由Claude完成,预测完全自动化AI研究可能一年内实现 [9] - 马斯克最新访谈称AI“硬起飞”已在发生,递归自我改进中人类参与度正迅速降低,并预测未来10年全球经济规模增长10倍 [12] - Science子刊发表研究显示,AI育儿聊天机器人使儿童发育水平提升0.11个标准差,达到传统家访效果的约65%,而成本仅为传统模式的1/15 [10]
腾讯研究院AI速递 20251217
腾讯研究院· 2025-12-17 00:32
苹果AI芯片战略 - 苹果正开发首款代号"Baltra"的AI服务器芯片,与博通合作开发网络技术,采用台积电3nm工艺,预计2027年部署 [1] - 苹果已放弃自建大模型,转而每年支付约10亿美元使用谷歌定制的1.2万亿参数Gemini模型,Baltra芯片主要用于满足庞大的AI推理需求 [1] - 芯片架构将注重时延与吞吐量优化,采用INT8等低精度运算,可能采用64颗芯片互连配合大容量LPDDR内存的方案 [1] 大模型技术进展 - 英伟达推出Nemotron 3系列开源模型,包含Nano、Super和Ultra三种规模,采用突破性异构混合专家架构 [2] - Nemotron 3 Nano的吞吐量比上一代高4倍,在大规模多智能体系统中实现领先的每秒生成token数,推理效率显著提升 [2] - 模型通过先进强化学习技术和大规模并行多环境后训练实现卓越准确率,并提供完整的训练数据集和强化学习库 [2] - 逆向工程发现ChatGPT记忆系统采用四层架构:会话元数据、用户记忆、近期对话摘要和滑动窗口,未使用向量数据库或RAG检索 [3] - ChatGPT通过预生成的轻量级摘要和显式保存的结构化信息实现记忆,GPT-4最大上下文窗口为128k token,超出后最前面的内容会被遗忘 [3] AI应用与内容生成 - 腾讯元宝上线写作模式,支持自动补全剧情人设大纲并一键生成成稿,单次可直出数万字文本 [4] - 元宝可在约14分钟生成约3万字,半小时写出5万字,并支持将长稿一键导出至本地文档或腾讯文档 [4] - 通义万相2.6成为国内首个支持角色扮演的视频模型,支持音画同步、多镜头生成及声音驱动 [5] - 视频生成支持15秒长视频、多镜头叙事和自然音画同步,能参考输入视频角色外观和音色实现单人、多人合拍 [5] - 图像生成升级包括艺术风格高度美学可控、真实人像质感提升、文字生成图表插画、图文混排输出和多图融合生成等功能 [6] - 字节跳动发布Seedance 1.5 pro音视频联合生成模型,支持精准音画同步、多语言方言、电影级运镜和15秒长视频生成 [7] - 模型采用MMDiT架构实现视听流精准协同,原生支持中英日韩等多语种及四川话粤语等方言,音频指令遵循处于业内头部水平 [7] 自动驾驶进展 - 工信部附条件许可长安深蓝SL03和极狐阿尔法S两款L3级自动驾驶车型,成为我国首批获准入的L3车型 [8] - 深蓝SL03可在拥堵环境下最高时速50km/h实现单车道自动驾驶,仅限重庆内环等指定路段;极狐阿尔法S最高时速80km/h,仅限北京京台高速等路段 [8] - 两家企业已完成并通过产品测试与安全评估,将在指定区域开展上路通行试点 [8] AI行业趋势与挑战 - 谷歌前CEO Eric Schmidt提出"旧金山共识",认为语言智能体与推理能力结合将趋近人类核心能力,技术融合到一定阶段会出现AI递归自我改进 [9] - 他预测AI数学家将在未来一年内出现推动新数学理论诞生,行业普遍认为这一变革在2-4年内发生 [9] - 美中AI竞争路径分化:美国聚焦超级智能研发但电力不足,中国全力推动AI商业应用落地且电力充足,两国均依赖私营部门推动发展 [9] - 多款AI模型面对六指手图像无法正确数出手指数量,暴露出当前AI在视觉推理、因果关系理解上的缺陷 [10] - 问题根源在于训练数据中"人手=五指"的强关联和Transformer架构缺乏显式结构约束,单次前向传递无法追踪状态信息 [10]