Workflow
DeepSeek-OCR 2
icon
搜索文档
突发!DeepSeek又“崩”了!
证券时报· 2026-03-31 20:45
服务异常事件分析 - 公司旗下服务在3月29日至31日连续三天发生服务异常,涉及网页对话、App及API,故障分别持续约1小时48分、10小时13分和1小时3分,其中3月30日的10小时13分中断是公司成立以来最长的一次服务中断 [1][5] - 服务中断事件在3月31日17时引发舆论关注,相关话题再次冲上热搜,目前所有服务已恢复稳定运行 [1] - 多名国产模型供应商人士推断,此次仅面向C端的产品服务中断可能与模型迭代过程中的灰度测试有关 [6] 模型迭代与V4发布相关推测 - 自2026年2月以来,公司多次错过预期发布窗口,其下一代模型DeepSeek V4仍未正式发布 [5] - 行业推测,3月初公司网页端在代码能力与上下文处理方面的增强更新,可能是DeepSeek V4在进行隐身测试 [6] - 有供应商分析认为,公司可能在4月正式发布V4前,提前面向C端用户群测试其新增的“原生推理层”在高并发请求下的稳定性 [6] - 在3月30日服务中断问题解决后,官方API文档中仍未列出任何关于V4模型的ID [7] - 有模型供应商分析,公司在冲击更高性能架构、扩张至百万Tokens级别推理能力的过程中,暴露了基础设施建设的短板,新旧架构在底层存储聚合层出现了冲突 [7] DeepSeek-OCR 2技术突破 - 公司于2026年1月27日发布DeepSeek-OCR 2模型,采用创新的DeepEncoder V2方法,使AI能基于图像含义动态重排图像片段,模仿人类追随场景逻辑流的方式处理图像,改变了传统AI从左到右刚性扫描的方式 [8][9] - 该模型在OmniDocBench v1.5基准测试中取得91.09%的成绩,相较于前代DeepSeek-OCR提升了3.73% [8] - 模型在保持高精度的同时严格控制计算成本,其视觉Token数量限制在256至1120之间,与Google的Gemini-3 Pro保持一致,在实际生产环境中处理在线用户日志和PDF预训练数据时的重复率分别下降了2.08%和0.81% [8] 技术架构与行业意义 - DeepEncoder V2的核心是引入可学习的“因果流查询”,使编码器具备因果推理能力,构建了“两个级联的1D因果推理结构”,有效弥补了2D图像结构与1D语言建模之间的鸿沟 [9][10] - 此次发布具有深远的架构探索意义,初步验证了使用语言模型架构作为视觉编码器的潜力,为迈向统一的全模态编码器提供了可能路径 [10] - 公司认为,“两个级联的1D因果推理器”模式通过将2D理解分解为“阅读逻辑推理”和“视觉任务推理”两个互补子任务,可能代表了实现真正2D推理的一种突破性架构方法 [10]
DeepSeek不发V4,六小龙不敢过年
36氪· 2026-02-12 08:26
文章核心观点 - DeepSeek在2026年初频繁发布技术更新,其新一代模型轮廓已初步成型,箭在弦上 [1] - 公司坚持“少花钱办大事”的极致性价比路线,通过架构创新(如Engram)而非堆砌算力来提升模型能效 [3][4] - 公司面临来自谷歌Gemini 3和OpenAI GPT-5等闭源巨头的巨大技术竞争压力,必须加快迭代以维持开源生态的护城河 [7][8][10] - 公司强大的开源生态和低成本策略对国内AI“六小龙”等同行造成巨大压力,并改变了行业竞争格局 [11][12] - 互联网大厂(字节、阿里、腾讯)正通过巨额投入和流量逻辑冲击AI入口,进一步挤压了“六小龙”的生存空间 [13] - DeepSeek即将发布的新模型(V4或R2)不仅关乎技术自证,更是一场开源生态主导权的保卫战,其影响充满不确定性 [13][14] DeepSeek的技术策略与进展 - 2026年1月中旬开源了名为Engram的“条件记忆”架构,旨在将模型记忆与计算分离,以降低错误并节省算力 [1][3] - 1月27日发布并开源了新一代文档理解模型DeepSeek-OCR 2 [1] - 技术社区对传闻中的“MODEL1”有两种猜想:追求极致效率的轻量级模型,或专门处理超长序列的“长序列专家” [3] - 公司独创了针对英伟达Hopper架构GPU深度优化的软件工具FlashMLA,是实现低成本、高性能的关键技术之一 [6] - 在没有全新模型时,公司通过即时推出V3.1、V3.2等改款产品并分享MoE架构等技术细节来保持市场存在感 [8] DeepSeek的生态与市场地位 - 公司的核心命门在于维护开源生态的护城河,而非C端用户数量 [8] - C端市场对公司而言更像是“技术展示厅”和“RLHF数据采集器” [8] - 其开源模型DeepSeek-V3和R1在HuggingFace累计下载量超千万次,迅速积累了庞大的开发者生态 [4] - 根据OpenRouter统计,DeepSeek-V3和R1的Token吞吐量一度占据所有开源Token的一半以上 [8] - 全球AI极客、实验室和创业公司在进行模型“蒸馏”、“微调”时,常将DeepSeek列为第一梯队选择,形成了隐形的技术定价权 [8][9] - 然而,闭源模型(如GPT、Gemini)仍占据市场主流,比例约为70% [9] 面临的竞争压力 - 谷歌Gemini 3 Pro在数学竞赛MathArena中得分高达23.4%,而包括GPT-5.1在内的其他大模型仅在1%上下挣扎 [7] - Gemini 3在编程能力基准测试Live Code Bench的Elo得分超过2400分,在工具调用和终端操作测试中名列第一 [7] - Gemini能通过Agent模式调动用户谷歌设备中的数据,形成生态协同 [7] - OpenAI与谷歌的激烈竞争直接拉升了整个闭源生态的技术上限,对DeepSeek构成威胁 [8] - 公司必须保持迭代速度,防止其开源模型能力与GPT-5、Gemini 3等最新闭源模型拉开代差,导致开发者流失 [7] 对国内AI行业的影响 - DeepSeek在2025年初月活登顶国产AIGC App,改变了国产大模型的叙事逻辑,加速了AI在大众生活中的渗透 [11] - 其崛起让腾讯、阿里、字节等传统互联网大厂意识到“AI即入口” [11] - 公司极致性价比的开源策略给国内同行带来了“窒息感” [11] - 其新模型迟迟未发,意外地为以智谱、MiniMax、月之暗面、阶跃星辰、百川智能、零一万物为代表的“六小龙”提供了约半年的喘息与融资窗口 [2][12] - 在此期间,月之暗面于2025年12月完成5亿美元C轮融资;智谱与MiniMax在2026年1月登陆港交所;阶跃星辰近期宣布完成50亿元B+轮融资 [12] - 互联网大厂在2026年春节发起流量大战:字节将火山引擎送上春晚;阿里拿下多个卫视春晚独家总冠;腾讯拿出10亿元为元宝App铺路 [13] - 大厂的流量逻辑与DeepSeek可能发布的新模型产生叠加效应,进一步挤压“六小龙”空间,迫使其转向垂直赛道深耕 [13]
国产AI应用迎爆发时刻,关注港股通互联网ETF易方达(513040)、软件ETF易方达(562930)投资价值
每日经济新闻· 2026-02-10 14:37
AI应用市场表现 - 2月10日午后AI应用方向持续活跃 中证港股通互联网指数上涨0.3% 成分股中阿里巴巴-W、小米集团-W、快手-W涨幅超过1% [1] - 中证软件服务指数上涨1% 成分股中光环新网涨幅超过7% 云天励飞-U涨幅超过6% 石基信息、虹软科技涨幅超过3% [1] 行业技术动态与产品发布 - 春节前后是国内大厂密集发布AI应用的关键窗口 字节跳动旗下即梦AI发布新一代视频生成模型Seedance 2.0 实现了多镜头叙事与导演级控制、精准音画同步与口型匹配以及增强的角色与场景一致性 使AI视频具备长篇叙事能力并朝影视工业级别迈进 [1] - 阿里云推出推理模型Qwen3-Max-Thinking 其性能媲美国际顶尖水平 标志着国产模型在高阶推理领域的重要突破 [1] - DeepSeek发布并开源能处理复杂图片的DeepSeek-OCR 2模型 多家企业接连发布新品 一场围绕AI技术的春节“竞赛”正在上演 [1] 相关投资工具 - 港股通互联网ETF易方达(513040)跟踪中证港股通互联网指数 该指数聚焦港股互联网平台公司并汇聚中国AI核心企业 [2] - 软件ETF易方达(562930)跟踪中证软件服务指数 该指数由A股中30只业务涉及软件开发、软件服务等领域的股票组成 覆盖AI+办公、AI+金融、AI+教育等各类落地场景 可助力投资者高效把握AI应用领域布局机会 [2]
Agent叙事强化,算力与SaaS分化加剧
华泰证券· 2026-02-08 12:20
行业投资评级 - 科技行业评级:增持(维持)[6] - 计算机行业评级:增持(维持)[6] 报告核心观点 - 2026年AI Agent的渗透是下一个Token加速点,行业正从“能力验证”走向“规模化应用”的关键拐点年[2][49] - 海外云厂商资本开支持续上修,AI需求表述乐观,算力侧Agent主线强化[2][50] - AI应用层面,云厂商业绩加速兑现,但SaaS市场预期偏悲观,部分公司有望通过产品价值下沉实现重估[3][57] - AI for Science在生物制药商业化最快,材料领域有望突破,预计2026年将成为重点应用与投资方向[4][89] - Agentic Coding加速迭代,将重构软件行业,软件开发成本面临“杰文斯悖论”[5][91] 根据目录总结 AI模型:Agent能力持续演进 - **DeepSeek-OCR 2提升视觉理解能力**:2026年1月底推出,参数规模约3B,在OmniDocBench v1.5上评分为91.09,较前代提高3.73个百分点,压缩效率方面仅用1120个视觉token实现较低编辑距离误差(0.100 vs Gemini-3 Pro的0.115)[10][18][22] - **Kimi K2.5引入并行Agent架构**:总参数量约1万亿,采用MoE架构,引入“Agent Swarm”并行Agent架构,可将多步任务总耗时减少4.5倍,端到端运行时间降低约80%[24][30] - **腾讯CL-bench揭示模型临时学习短板**:基准测试显示,主流模型在CL-bench上整体成功率偏低,GPT-5.1(High)平均成功率仅为23.7%[32] AI算力:Agent主线强化,CSP Capex持续上修 - **Agent渗透驱动算力消耗指数级增长**:Agent推理范式复杂,算力消耗大,以Claude Code为例,完成一个小项目可能消耗百万级别token,相比Chatbot单次交互消耗提升3个数量级[47] - **海外云厂商资本开支快速增长**:2025年第四季度,海外四大CSP资本开支合计1270亿美元,同比增长63%,环比增长13%,其中Microsoft/Google/Meta/Amazon的资本开支同比分别增长66%/95%/49%/52%[50] - **下一代光互连方案CPO/NPO进入产业化元年**:英伟达Rubin Ultra机架将采用NPO方案,预计2026年上半年开始部署,CPO技术进入规模化商用阶段[52][56] AI应用:云厂商业绩加速兑现,静待SaaS预期修正 - **云厂商业绩持续加速**:2025年第四季度,Microsoft、Google、Amazon云业务收入同比增速分别为39%、48%、24%,下游需求持续高增[59] - **传统SaaS加速产品价值下沉**:例如ServiceNow的AI Control Tower订单量环比增长近3倍,SAP的Business Data Cloud累计合同金额约20亿欧元[63] - **Palantir提供业绩范式参考**:2025年第四季度总营收14.07亿美元,同比增长70%,其中美国商业收入同比增长137%,积压订单(RPO)达42.10亿美元,同比增长43%[66][68] AI4S:生物制药商业化最快,材料领域有望突破 - **AI制药合作深化与爆发**:2026年1月,赛诺菲与Earendil Labs的合作总价值从18.45亿美元提升至25.6亿美元,标志着AI驱动抗体药物研发投入加大[79][80] - **AI新材料研发范式变革**:微软的MatterGen能够根据性能需求从头生成新材料,相比传统筛选方法,在同等计算成本下发现的新材料数量远超数个量级[82][85] - **产业合作进入验证阶段**:2026年1月,晶泰控股与晶科能源子公司合作,共建全球首个“AI决策-机器人执行-数据反馈”全闭环叠层电池智造线[87] 月专题:Agentic Coding加速迭代 - **AI Coding成为企业AI支出热点**:占企业部门级AI支出的55%,正从代码补全向自主执行任务的Agentic Coding范式跃迁[92] - **AI Coding能力快速演进**:预计目前已能构建5000-20,000行代码的中型系统,未来两年可能实现中型系统完全自主生成[92][93] - **中美厂商加速布局**:海外以Claude Code、Cursor、GitHub Copilot等为代表,国内阿里巴巴、字节跳动、百度、腾讯、DeepSeek等厂商均有产品布局[101][102][103] - **对软件行业价值锚点产生冲击**:软件价值将从交互外壳向逻辑内核、从记录系统向执行系统、从封闭系统向开放接口转移,软件开发成本面临“杰文斯悖论”[104]
红包“四国杀”,打响AI入口争夺战
深圳商报· 2026-02-06 06:54
2026年春节AI红包大战核心观点 - 互联网大厂通过高额现金红包和补贴活动,争夺AI产品入口和用户,本质是以短期资金密集投入换取长期AI赛道主导权,是一场全国范围、高密度的真实用户压力测试,或将影响未来AI流量分发 [2][6][8] 主要参与方及投入 - **腾讯**:通过“元宝”APP于2月1日开启新春活动,分10亿元现金红包,用户通过登录、分享、做任务可获得抽奖机会,最高可抽“万元小马卡”,活动初期效果显著,一度登上苹果应用商店免费APP榜首 [2][3] - **阿里巴巴**:通过“千问”APP于2月2日宣布投入30亿元启动“春节请客计划”,以免单形式请客吃喝玩乐,并联动淘宝、飞猪、盒马、支付宝等阿里生态业务,这是阿里历史上春节活动投入最大的一次 [2][4] - **百度**:于1月25日加入战局,投入5亿元春节红包,用户可通过百度APP搜索“春节红包”在1月26日至3月12日期间瓜分,玩法主打体验AI特效、观看视频等 [2][4] - **字节跳动**:未官宣现金红包活动,但其火山引擎在去年底已成为总台春晚独家AI云合作伙伴,将基于多模态大模型和云计算技术深度参与春晚节目、互动和直播 [2][4] 战略意图与行业背景 - 此次红包大战与以往“撒钱拉新”不同,核心是“AI功能深度绑定”,红包成为AI产品的用户教育工具,目标是实现AI助手全民化,瓜分未来十年的用户市场 [6] - 人工智能基础设施已建设完毕,2026年开年大厂在技术、模型、人才、生态上竞争激烈,红包大战是AI时代标志性事件,加速了AI的全民普及与场景落地 [6][8] - 中国人工智能产业规模持续增长,2024年核心产业规模已突破9000亿元,同比增长24%,2025年有望达1.2万亿元,截至2025年底,中国人工智能企业数量超过6000家,全球占比达16% [10] 各公司AI业务整合策略 - 腾讯元宝围绕社交优势展开活动 [5] - 阿里巴巴千问围绕本地支付和生态整合,旨在融入真实生活消费 [4][5] - 百度围绕搜索体验设计红包玩法 [5] - 字节跳动火山引擎/豆包侧重于内容与云服务 [4][5] 近期AI技术进展 - **阿里巴巴**:于1月27日正式发布千问旗舰推理模型Qwen3-Max-Thinking,总参数量超1万亿,预训练数据量高达36T Tokens [6][7] - **DeepSeek**:同期发布并开源全新DeepSeek-OCR 2模型,采用创新的DeepEncoder V2方法 [6][7] - **腾讯**:混元团队与复旦联合发布论文《CL-bench》,系统阐述前沿模型在上下文学习能力的核心瓶颈 [7] - **字节跳动**:火山引擎已成为中国公有云大模型市场份额最高的AI云服务商,其豆包大模型日均调用量达63万亿Tokens,服务上百万家企业,超100家企业累计调用量突破1万亿Tokens [7] 对用户留存与行业发展的看法 - 红包营销能在短期内快速获取用户,但无法替代产品价值,长期留存的关键在于AI助手的“智能化”程度、产品体验的流畅度和准确性,以及能否解决用户真实痛点、融入日常工作流等刚需场景 [9][10] - 单纯靠补贴留存的用户“卸载成本”极低,红包停止后留存率可能出现断崖式下跌,大厂需在技术、场景、生态三个层面迅速跟进,将流量转化为商业价值 [9][10] - 大厂需加强稳定性测试,应对红包活动带来的巨量瞬时算力消耗,避免因等待时间过长或宕机对用户黏性造成负面影响 [9]
人工智能促变革 美企滥用引风波——2026年首月全球AI产业动态
新华社· 2026-02-03 15:40
全球AI技术研发与芯片竞争 - 英伟达在1月初的CES上推出包含6款芯片的系统级AI算力平台“薇拉·鲁宾” [2] - 微软在1月底发布AI芯片Maia 200,旨在推动更深层推理和多步骤智能体功能 [2] - 阿里巴巴旗下半导体公司平头哥发布AI芯片“真武810E”,采用自研并行计算架构和片间互联技术,并配合全栈自研软件 [2] - 谷歌旗下深层思维公司向公众开放基于世界模型Genie 3的工具,用户可通过自然语言描述即时创建并探索可交互的三维虚拟世界 [2] 中国大模型创新与开源进展 - 阿里巴巴发布Qwen3-Max-Thinking模型,以超万亿参数规模创下其推理大模型迭代规模纪录 [2] - 月之暗面推出并开源Kimi K2.5模型,在智能体任务、代码生成、图像视频处理等领域表现突出 [2] - 深度求索公司开源DeepSeek-OCR 2模型,通过更接近人类阅读逻辑的视觉编码技术,提升对复杂文档、表格与公式的识别精度 [2] AI应用落地与跨领域突破 - 智能体Clawdbot(已改名OpenClaw)在全球流行,能根据用户指示操作电脑、应用程序和网络完成整理文件、修改代码、管理投资等复杂任务 [3] - 专门为智能体开发的聊天平台Moltbook,据报道已有上百万个智能体在上面交流 [3] - 深度学习模型AlphaGenome的研究成果登上《自然》期刊封面,该模型能解码人类基因组中占98%的“暗基因组”,有助于研究遗传疾病和改进基因检测 [3] - 中国企业国星宇航已将Qwen3大模型部署至“星算”计划01组太空计算中心 [3] - 美国航天局“毅力”号火星车在火星表面首次完成由AI规划路线的行驶任务 [3] AI安全事件与全球治理动态 - 美国xAI公司的聊天机器人“格罗克”因其图片编辑功能被用于生成基于真人的色情内容,在多国引发风波并受到强烈谴责 [4] - 在印度尼西亚、马来西亚和英国等国宣布限制措施或启动调查后,X平台宣布禁止“格罗克”生成基于真人的伪造性暴露图像 [4] - 韩国1月正式施行《关于人工智能发展和构建信赖基础的基本法》,哈萨克斯坦通过《数字法典》,均强调AI的安全发展 [4] 国际社会对AI合作的态度 - 马来西亚国家网络安全局局长表示,能力建设是马中AI合作的重要方向,马来西亚高度重视并持续深化与中国在相关领域的合作 [6] - 沙特数据和人工智能管理局发言人表示,中国在AI领域技术实力雄厚,是沙特推进AI和数字经济发展的重要合作伙伴 [6] - 巴西科技创新部长表示,AI等技术是提升农业生产效率的关键,希望与中国共同推动技术进步和产业升级 [6]
特稿丨人工智能促变革 美企滥用引风波——2026年首月全球AI产业动态
新华社· 2026-02-03 13:51
全球AI产业技术研发动态 - 英伟达在1月初推出包含6款芯片的系统级AI算力平台“薇拉·鲁宾” [2] - 微软在1月底发布AI芯片Maia 200,旨在推动更深层推理和多步骤智能体功能 [2] - 阿里巴巴旗下平头哥发布AI芯片“真武810E”,采用自研并行计算架构和片间互联技术 [2] - 阿里巴巴发布Qwen3-Max-Thinking模型,参数规模超万亿,创下公司推理大模型迭代规模纪录 [2] - 月之暗面推出并开源Kimi K2.5模型,在智能体任务、代码生成、图像视频处理等领域表现突出 [2] - 深度求索公司开源DeepSeek-OCR 2模型,通过改进的视觉编码技术提升对复杂文档、表格与公式的识别精度 [2] - 谷歌旗下深层思维公司向公众开放基于世界模型Genie 3的工具,用户可通过自然语言描述创建并探索交互式三维虚拟世界 [2] AI应用落地与前沿突破 - 智能体Clawdbot(已改名OpenClaw)在全球流行,能根据指示操作电脑完成整理文件、修改代码、管理投资等复杂任务 [3] - 专为智能体开发的交流平台Moltbook已有上百万个智能体在上面互动 [3] - 深度学习模型AlphaGenome的研究成果登上《自然》期刊封面,该模型能解码人类基因组中占98%的“暗基因组” [3] - 中国企业国星宇航已将Qwen3大模型部署至“星算”计划01组太空计算中心 [3] - 美国航天局“毅力”号火星车在火星表面首次完成由AI规划路线的行驶任务 [3] 行业监管与安全事件 - 美国xAI公司的聊天机器人“格罗克”因被用户用于生成基于真人的色情内容,在印度尼西亚、马来西亚和英国等多国引发调查与限制 [4] - 社交媒体平台X随后宣布禁止“格罗克”生成基于真人的伪造性暴露图像,该限令适用于所有用户包括付费用户 [4] - 在达沃斯世界经济论坛年会上,多方探讨了建立针对AI的国际多边监管机制 [5] - 韩国1月正式施行《关于人工智能发展和构建信赖基础的基本法》 [5] - 哈萨克斯坦通过《数字法典》,强调AI的安全发展 [5] 国际合作趋势 - 马来西亚国家网络安全局局长表示,能力建设是马中AI合作的重要方向,马来西亚高度重视并希望深化与中国合作 [6] - 沙特数据和人工智能管理局发言人表示,中国技术实力雄厚,是沙特推进AI和数字经济发展的重要合作伙伴 [6] - 巴西科技创新部长表示,AI是提升农业生产效率的关键,希望与中国共同推动技术进步和产业升级 [6]
领军企业密集推出新技术 AI产业创新步伐加快
科技日报· 2026-02-02 13:07
中国AI产业竞争格局升温 - 新春临近,中国AI产业竞争日渐升温,短时间内形成百度、阿里、DeepSeek三足鼎立格局,创新步伐明显加快 [1] 百度文心大模型5.0的技术与市场表现 - 百度于1月22日正式上线采用原生全模态统一建模技术的文心5.0正式版,支持文本、图像、音频、视频等多种信息的输入与输出 [1] - 文心5.0采用统一的自回归架构进行原生全模态建模,将多源数据在同一模型框架中联合训练,实现原生的全模态统一理解与生成,与业界多数“后期融合”方案不同 [1] - 在LMArena全球大模型竞技场榜单中,文心5.0多次位居文本榜和视觉理解榜国内第一,跻身国际第一梯队 [1] - 具体数据显示,文心大模型ERNIE-5.0-0110在LMArena文本榜中排名第8,得分为1460,位列国内第一 [2] 阿里巴巴的模型创新与生态整合 - 阿里于1月26日正式发布千问旗舰推理模型Qwen3-Max-Thinking,创新推理技术,实现性能跃升 [1] - Qwen3-Max-Thinking采用全新的测试时扩展机制,可对先前推理结果进行“经验提取”式提炼并进行多轮自我迭代,在提升性能的同时更加经济 [3] - 阿里以应用生态为抓手,推动千问大模型打通电商、酒旅、支付等自身优势领域,深度接入淘宝、支付宝、飞猪等平台,实现技术与场景高效协同 [3] DeepSeek的开源策略与技术创新 - DeepSeek推出全新DeepSeek-OCR 2模型并开源,专注于底层能力与开放生态建设 [1] - DeepSeek通过“模型权重+训练框架+部署工具”的全栈开源,将性价比优势发挥到极致 [3] - DeepSeek-OCR 2采用创新的DeepEncoder V2方法,让模型可根据图像含义动态重排图像各部分,模拟人类观看场景的逻辑流程,在处理复杂图片时更智能、更有逻辑 [3] - 其开源技术已融入众多垂直场景,推动AI技术向千行百业低成本渗透 [3] 百度的后续动作与全栈能力 - 1月29日,百度发布并开源了文心衍生模型Paddle OCR-VL-1.5,直接对标DeepSeek-OCR-2 [4] - Paddle OCR-VL-1.5在相关权威榜单中位列全球第一,并首创OCR模型的“异形框定位”技术,能精准识别拍歪、折角、卷边的不规则文档 [4] - 作为极少数具备全栈AI能力的企业,百度在软硬协同、场景落地方面有持久投入 [8] - 在底层硬件方面,百度孵化的AI芯片品牌昆仑芯已启动独立上市进程,并已点亮国内首个全自研三万卡昆仑芯集群,可同时支撑多个千亿参数大模型训练 [8] - 基于文心基础大模型,百度构建了面向产品级应用的矩阵模型和面向行业应用的专精模型 [8] - 例如,文心数字人大模型已在直播电商等领域实现规模应用,2025年“双11”期间,数字人直播商品交易总额同比增长91%,开播直播间数增长119%,超10万商家使用 [8] 行业发展阶段与趋势 - 自2025年春节DeepSeek走红以来,中国AI一直是国际科技领域的热门话题 [9] - 经过一年多发展,AI技术正在中国迈入规模化落地新阶段,其价值在驱动产业变革、创造社会效益中得到进一步验证 [9] - 虽企业发展路径不同,但背后是一条清晰的创新能力升级之路,共同推动中国AI产业从“追赶”迈向“领跑” [9]
全民Agent时代,算力价值凸显
国盛证券· 2026-02-01 16:58
报告行业投资评级 - 行业评级:增持 [52] 报告核心观点 - 以ClawdBot和Claude Excel为代表的AI智能体正从“对话交互”迈向“生产力工具”新范式,其复杂、长链条的任务模式导致单次交互消耗的Token急剧膨胀,催生了指数级增长的持续性算力需求 [1][5][7] - AI智能体应用场景扩展至亿级用户基础的通用办公场景,调用模式从“偶发”变为“高频”和“长时”,对算力服务提出高并发和持续在线的新要求,驱动算力基础设施架构革新 [5][7] - AI应用驱动的推理算力需求激增,推动云服务价格回升,同时全球主要云厂商资本支出指引显著增长,算力竞赛持续加码 [4][6][10][24] - 市场关注度将重新聚焦于算力和光通信核心主线,继续看好光通信、液冷、太空算力三个方向 [7][15] 根据相关目录分别总结 1. 投资策略:全民 Agent 时代,算力价值凸显 - 建议关注算力产业链,包括光通信、铜链接、算力设备、液冷、边缘算力承载平台、卫星通信、IDC、母线等多个细分领域 [8][14] - 推荐光模块行业龙头中际旭创、新易盛等,同时建议关注光器件“一大五小”天孚通信、仕佳光子、太辰光、长芯博创、德科立、东田微,以及液冷环节的英维克、东阳光等 [7][15] 2. 行情回顾:通信板块上涨,光通信表现相对最优 - 报告期内(2026年01月26日-2026年02月01日),通信板块上涨,表现强于上证综指 [16] - 从细分行业看,光通信指数上涨12.5%,云计算指数上涨4.9%,运营商指数上涨1.1% [17][19] - 量子通信、通信设备、物联网、区块链、移动互联、卫星通信导航指数分别下跌1.4%、3.7%、5.9%、6.0%、6.1%、10.9% [17][19] - 网宿科技受益于液冷概念,本周上涨44.251%,领涨板块;天孚通信受益于CPO概念,上涨31.333% [17][18] 3. 全民 Agent 时代,算力价值凸显 - **应用革命**:AI应用形态发生根本转变,从“玩具”加速向生产力工具转变,以Clawdbot和Claude Excel为代表的新一代应用深度嵌入工作场景,成为工作流核心执行者 [2][21] - **需求引爆**:AI Agent正经历从“辅助工具”向“自主主体”的范式变迁,直接导致对底层算力需求的质变 [3][22] - **算力竞赛**: - 谷歌云宣布自2026年5月起上调全球数据传输服务价格,北美地区费率较当前水平提高约一倍 [10][24] - 亚马逊AWS宣布对其面向大模型训练的EC2机器学习容量块服务上调约15% [10][24] - Meta 2025年全年资本性支出为722亿美元,主要投向AI算力基础设施;2026年资本支出指引为1150亿至1350亿美元,较2025年增长约73% [10][24] - 微软FY25Q2资本开支达到375亿美元,单季支出创纪录,同比增长近66%,绝大部分流向云和AI基础设施 [10][24] 4. 阿里发布千问旗舰推理模型 Qwen3-Max-Thinking - 阿里于1月26日发布千问旗舰推理模型Qwen3-Max-Thinking,总参数超万亿,在19项权威基准测试中性能可媲美GPT-5.2-Thinking等顶尖模型 [26] - 该模型大幅增强了自主调用工具的原生Agent能力,并降低了模型幻觉 [26] - 在科学知识(GPQA Diamond)、数学推理(IMO-AnswerBench)、代码编程(LiveCodeBench)等多项关键性能基准测试中达到国际领先水平 [27] 5. DeepSeek-OCR 2 发布 - DeepSeek于1月27日发布新一代文档识别模型DeepSeek-OCR 2,其核心创新在于视觉编码器设计,引入“视觉因果流”概念 [28] - 在OmniDocBench v1.5基准测试中,整体得分达到91.09%,相较DeepSeek-OCR提升3.73% [29][30] - 阅读顺序准确度提升,编辑距离从0.085降至0.057 [30] 6. IonQ 宣布收购晶圆代工厂 SkyWater - 美国量子计算公司IonQ于1月27日宣布以18亿美元现金和股票收购纯晶圆代工厂SkyWater [31] - 收购价格较SkyWater过去30天平均股价溢价38% [31] - 此举旨在构建全栈垂直整合量子平台,目标在2028年进行20万物理量子比特单元的功能测试 [32] 7. 微软发布新定制 AI 芯片 Maia 200 - 微软于1月27日发布定制AI加速芯片Maia 200,采用台积电3nm制程工艺 [33] - 其FP4性能达亚马逊第三代Trainium芯片的三倍,FP8性能超过谷歌第七代TPU;与微软现有最新硬件相比,每美元性能提升约30% [33] - 该芯片为专门的推理加速器,旨在降低运行ChatGPT、Copilot等服务的成本,并采用了更高效的水冷设计方案 [33][34] 8. 2025年我国电信业务收入 - 2025年,我国完成电信业务收入1.75万亿元,同比增长0.7% [35] - 以云计算、大数据、物联网、数据中心等为主的新兴业务收入比重升至25.7%,同比增长4.7%,拉动电信业务收入增长1.2个百分点 [35] - 截至2025年底,我国5G基站数达483.8万个;可调度智能算力规模超94.4 EFlops,同比增长87.6% [37][38] 9. 阿里自研高端 AI 芯片真武 810E 亮相 - 阿里巴巴旗下平头哥半导体官网上线高端AI芯片“真武810E”,采用全自研架构,单卡配备96GB HBM2e内存 [39] - 该芯片已在阿里云实现多个万卡集群部署,服务超400家客户,整体性能与英伟达H20相当 [39] - 标志着阿里巴巴成功构建“大模型+云+芯片”的AI全栈自研闭环 [40] 10. Meta 逐步弱化 VR 强化 AI - Meta CEO扎克伯格表示,公司正收缩虚拟现实投入,转向AI眼镜和可穿戴设备,预计Reality Labs的亏损将逐步减少 [41] - Reality Labs在2025年亏损超过190亿美元 [41] - Meta智能眼镜在2025年的销量“增长了三倍以上” [42] 11. 微软 Copilot 用户增长 - 微软CEO纳德拉称,面向消费者的Copilot产品日活跃用户同比增长接近3倍 [43] - GitHub Copilot付费订阅用户达470万,同比增长75% [44] - Microsoft 365 Copilot已有1500万个企业付费席位 [44]
AI周报|AI助手Clawdbot走红;Meta今年资本支出将翻倍
第一财经· 2026-02-01 09:34
AI助手Clawdbot/Moltbot走红与云厂商接入 - 一款名为Clawdbot(后更名为Moltbot)的AI助手从海外火到国内,成为2026年开年最受瞩目的AI爆款,其功能类似线上版“贾维斯”,可帮助用户清空收件箱、发送邮件、管理日历、办理航班值机等,并通过WhatsApp、Telegram等聊天APP以对话形式操控设备执行任务 [2] - 作为一个免费开源项目,Clawdbot迅速吸引了大量开发者与从业者参与测试,同时,国内腾讯云、阿里云、优刻得等云厂商火速接入,提供一键部署服务 [1][2] 国产大模型密集发布与行业进展 - 多家国产模型厂商近日更新模型进展:DeepSeek开源了新的OCR 2模型,Kimi发布并开源了其迄今为止最智能的Kimi K2.5模型,阿里发布了千问旗舰推理模型Qwen3-Max-Thinking [3] - 行业人士表示,节前大模型行业的密集动作是行业开始迈向工程化成熟期的关键信号,2026年春晚已因字节跳动火山引擎与豆包大模型、腾讯元宝、百度的提前卡位锁定热度 [3] 国际科技巨头AI与模型动态 - 谷歌DeepMind向外部开放了世界模型Project Genie,用户可通过文本提示或图片生成虚拟世界并操控角色探索,目前通过网页应用向美国地区Google Ultra账户用户开放,每次体验被限制在60秒以内 [4] - Meta发布2025年第四季度财报,营收598.9亿美元,同比增长24%,净利润227.7亿美元,同比增长9%,公司预计2026年资本支出将在1150亿至1350亿美元之间,较2025年的722.2亿美元最高接近翻倍,主要源于为支持AI超级智能实验室和核心业务的投资 [6] - 有消息称,马斯克旗下的SpaceX和xAI正在商讨合并事宜,计划在年内晚些时候一同IPO上市,若合并落地,火箭、星链、社交媒体平台X及AI聊天机器人Grok业务将被整合,根据拟议方案,xAI股票将转换为SpaceX股票 [5] 消费电子与半导体产业链动态 - 苹果发布2026财年第一季度财报,营收1437.6亿美元,同比增长16%,净利润421亿美元,同比增长16%,公司CEO预计存储涨价对第二季度毛利率的影响会比第一季度更大,因AI数据中心建设吸收了太多存储产能导致供不应求 [7] - 三星电子2025年第四季度存储业务销售收入37.1万亿韩元,环比增长39%,同比大涨62%,SK海力士第四季度营收环比增长34%至32.83万亿韩元,营业利润环比增长68%至19.17万亿韩元,均创历史新高,去年SK海力士营业利润翻倍,三星电子营业利润同比增长65% [12] - 寒武纪发布业绩预告,预计2025年营收60亿元至70亿元,同比增长410.87%到496.02%,净利润18.5亿元至21.5亿元,将实现同比扭亏为盈,主要受益于人工智能行业算力需求的持续攀升 [10] 国内AI应用与产品更新 - 腾讯元宝开始内测社交玩法“派”,用户可创建群聊并邀请微信、QQ好友加入,在群内可@元宝回答问题、总结聊天内容等,“派”将于近期公测并加入找电影、在线看电影、听音乐等功能 [8] - 搜狗输入法发布20.0版本并宣布全面AI化,完成了AI语音、AI翻译、AI打字三种模型的升级,在19个使用场景中缺词率下降5%~14%,并支持30多种语言与中文互译 [9]