Workflow
百度文心5.0
icon
搜索文档
人工智能周报(26年第4周):MiniMax Agent 2.0正式发布,百度文心5.0上线-20260126
国信证券· 2026-01-26 11:18
报告行业投资评级 - 行业评级:优于大市 [1][4] 报告核心观点 - 伴随大模型在多模态、长文本、推理能力等方面的成熟,2026年有望迎来更多成熟Agent产品的涌现,推理侧需求的增加将带动上游云计算厂商的收入持续增长 [2][25] - 国内互联网巨头在AI资本支出方面的投入落后海外约一年,伴随后续大模型能力逐步提升和建设供给的释放,AI对于巨头主业的赋能将持续显现 [2][25] - 2026年第三季度预计为互联网巨头外卖大战的投入峰值,第四季度预计将环比看到阿里巴巴、美团和京东三家外卖亏损有所收窄 [2][25] - 建议聚焦AI主线选股,推荐阿里巴巴、腾讯控股 [2][25] 人工智能动态:公司动态 - 字节跳动旗下AI Agent平台“扣子”2.0版本正式上线,核心升级在于引入Agent Skills和Agent Plan概念,新增技能商店,允许用户设立长期目标由AI自主执行 [17] - 安克创新与飞书联合发布“AI录音豆”硬件产品,直径23.2毫米,重量10克,支持8小时连续录音,配合充电舱综合录音时间可达32小时 [17] - MiniMax的AI原生工作台Agent 2.0上线,以Desktop App和Expert Agents为核心组件,分别注重执行力和对业务场景的理解 [19] - 美国AI初创公司Humans&获得4.8亿美元种子轮融资,估值达44.8亿美元,参与方包括英伟达、亚马逊创始人贝索斯、谷歌风投等 [19] - 特斯拉人形机器人Optimus计划于2027年底前向公众出售,量产版定价将低至2万美元(约合14.5万元人民币) [20] - 谷歌Gemini与美国教育机构The Princeton Review合作,上线免费SAT完整模拟考试功能 [20] - xAI在其多模态创作工具Grok Imagine中推出10秒视频生成功能,将之前的5秒生成时长翻倍 [21] 人工智能动态:底层技术 - 智谱AI发布并开源轻量级大语言模型GLM-4.7-Flash,为总参数30B、激活参数3B的混合专家架构模型 [22] - DeepSeek新模型“MODEL1”曝光,推测可能是一个高效推理模型或针对长序列优化的专家模型 [22] - 阿里通义千问开源Qwen3-TTS系列语音生成模型,包含1.7B和0.6B两种尺寸,支持音色克隆与创造,覆盖10种主流语言 [23] - 百度发布文心大模型5.0正式版,参数规模达2.4万亿,采用原生全模态统一建模技术,在40余项权威基准测评中,其语言与多模态理解能力超越Gemini-2.5-Pro、GPT-5-High等模型 [23] - 谷歌DeepMind发布D4RT四维视觉AI模型,采用统一的“时空查询”架构,相比现有技术处理速度提升了18至300倍 [24] AI相关网站流量数据 - ChatGPT周平均访问量为373.00百万,环比增长1.16% [10] - Bing周平均访问量为787.60百万,环比增长1.25% [10] - Gemini周平均访问量为477.90百万,环比增长4.44% [10] - 通义千问周平均访问量为8.16百万,环比增长11.75% [10] - 文心一言周平均访问量为4.61百万,环比下降2.10% [10] 重点公司盈利预测及投资评级 - 腾讯控股:投资评级“优于大市”,昨收盘价595.0港元,总市值5,428,115百万港元,2025年预测经调整EPS为27.60,预测PE为20.3倍 [3] - 阿里巴巴-SW:投资评级“优于大市”,昨收盘价168.5港元,总市值3,218,226百万港元,2025年预测经调整EPS为6.66,预测PE为23.8倍 [3] - 美团-W:投资评级“优于大市”,昨收盘价97.6港元,总市值596,193百万港元,2025年预测经调整EPS为-1.26,2026年预测经调整EPS为5.20 [3] - 百度集团-SW:投资评级“优于大市”,昨收盘价160.5港元,总市值441,402百万港元,2025年预测经调整EPS为7.64,预测PE为19.7倍 [3] - 快手-W:投资评级“优于大市”,昨收盘价81.3港元,总市值354,532百万港元,2025年预测经调整EPS为4.68,预测PE为16.3倍 [3]
腾讯研究院AI速递 20260126
腾讯研究院· 2026-01-26 00:01
OpenAI Codex技术进展 - OpenAI预告下周起将发布Codex相关重磅内容,并发布技术博客揭秘其CLI核心架构——智能体循环 [1] - 智能体循环通过Responses API协调用户指令、模型推理与本地工具执行,采用“提示词前缀一致”策略触发缓存以优化性能 [1] - Codex支持零数据保留配置以保障隐私,并利用自动压缩技术管理上下文窗口 [1] 谷歌DeepMind动态4D重建技术突破 - 谷歌DeepMind发布D4RT,将3D重建、相机追踪、动态物体捕捉统一成“查询”动作,速度比现有SOTA快18至300倍 [2] - 核心技术是统一的时空查询接口,AI先全局“阅读”视频生成场景表征,再按需搜索任意像素的3D轨迹、深度和位姿 [2] - 该技术对具身智能、自动驾驶和AR意义重大,但训练仍需10亿参数模型和64个TPU [2] Claude产品功能升级 - Claude Code将内部“Todos”升级为“Tasks”,支持多会话或子代理协作完成跨越多个上下文窗口的长期复杂项目 [2] - Tasks存储在文件系统中便于多个会话协同,当一个会话更新Task时会广播给所有处理同一任务列表的会话 [2] - Anthropic推出Claude in Excel插件,支持Pro、Max、Team、Enterprise用户,基于Opus 4.5模型,能联网搜索并自动填充表格,支持读取公式、Debug错误、从零建模、制作透视表等功能 [6] 百度文心大模型发布 - 百度文心5.0正式版上线,参数量达2.4万亿,采用原生全模态统一建模技术,支持文本、图像、音频、视频的理解与生成 [3] - 在LMArena文本和视觉理解榜单五次登顶,进入全球第一梯队,语言与多模态理解能力稳居国际领先 [3] - 实测显示模型在复杂情感理解、弦外之音分析、创意写作等文科任务表现突出 [3] AI智能体与开源项目动态 - 开源项目Clawdbot在硅谷爆火,可在Mac mini上运行,兼具本地AI智能体和聊天网关双重身份,通过WhatsApp、iMessage等随时对话 [4] - Clawdbot解决了大模型记忆力痛点,能记住两周前的对话,还会主动推送邮件、日程提醒,并可直接操控电脑执行任务 [4] - 项目GitHub获9.2k星,最低月成本约25美元,用户反馈它能自动管理生意、写代码替代Zapier等付费服务 [4] AI研究新范式与行业观点 - 图灵奖得主LeCun创立的AMI Labs官宣核心方向为“世界模型”,旨在构建理解现实世界、具备持久记忆和推理规划能力的智能系统 [5] - 该路线认为仅靠预测下一个token无法真正理解现实,需在更高层次表征空间进行预测与推理,过滤不可预测的噪声信息 [5] - 谷歌云AI总监Addy Osmani警告“氛围编程”已撞南墙,AI能完成70%前期工作但剩余30%只有经验丰富的工程师能搞定,2026年真正核心竞争力是把模糊问题转化为明确执行意图、设计好上下文结构 [7] 科技巨头对AI发展的预测 - 马斯克预测2026年底前AI将超越人类智慧,到2030年AI将比全人类集体智慧更聪明,特斯拉明年底将开售人形机器人Optimus [8] - 微软CEO纳德拉警告若AI只消耗资源不改善结果社会会失去容忍,黄仁勋称具身智能是“一代人一次的机会” [9] - DeepMind CEO哈萨比斯认为AGI还需5-10年,Anthropic CEO达里奥称只差6-12个月模型就能端到端完成软件开发 [9]