Workflow
大语言模型
icon
搜索文档
计算机行业周报:DeepSeek开源含Engram模块,千问助理重塑人机交互-20260119
华鑫证券· 2026-01-19 22:32
行业投资评级 - 报告对计算机行业维持“推荐”评级 [1] 核心观点 - 报告认为人工智能行业正从“纯聊天对话交互”阶段迈入“场景化办事落地”的全新发展阶段 [3][47] - 阿里千问App的升级标志着其完成了从交互工具向任务执行入口的关键转型验证了AI在真实生活场景中落地的可行性并展示了巨大的商业潜力 [4][47] - 基于单点突破向全场景渗透的积极态势报告持续看好AI应用板块 [4][47] 算力动态 - 上周(2026年1月12日至1月18日)周度token消耗量为7.65T环比增长18.97% [11] - 在tokens规模前五名中Anthropic的ClaudeOpus4.5以623B位居榜首ClaudeSonnet4.5以615B位列第二小米的MiMo-V-Flash以546B排第三xAI的GrokCodeFast1以468B位列第四Google的Gemini3FlashPreview以448B排第五 [11] - 从市场份额看Google以392Btokens占据34.2%的份额稳居首位Anthropic以140Btokens占比12.2%位列第二xAIOpenAIDeepseek则分别以134B126B94.1Btokens对应占据11.7%11.0%8.2%的市场份额 [11] - 上周算力租赁价格平稳例如显卡配置为A100-40G中腾讯云16核+96G价格为28.64元/时阿里云12核+94GiB价格为31.58元/时 [17] - 2026年1月13日DeepSeek开源了含Engram模块的论文及代码该模块提出“查—算分离”机制通过引入可扩展的查找记忆结构在等参数等算力条件下显著提升模型在知识调用推理代码数学等任务上的表现 [2][17] - Engram模块基于哈希N-Gram嵌入实现O(1)确定性检索算力消耗极低其位于Transformer层早期负责模式重构与记忆检索与负责深层推理的MoE专家形成互补极大优化了参数效率 [2][20][22] - Engram模块可能成为DeepSeek即将发布的V4模型的核心技术基础预示其下一代模型将在记忆和推理协同上实现架构级提升 [23] AI应用动态 - 本期(2026年1月10日至1月16日)AI相关网站周访问量前三分别为ChatGPT(1305.0M)Bing(780.2M)和Gemini(469.0M)访问量环比增速第一为QuillBot增长13.20% [25][26] - 平均停留时长前三分别为Character.AI(00:18:16)Discord(00:10:47)和Kimi(00:08:27)平均停留时长环比增速第一为文心一言增长2.96% [25][26] - 2026年1月15日阿里旗下的千问APP正式上线了全新的AIAgent功能“任务助理”并宣布全面接入阿里生态内的超过400项服务功能 [2][27] - 千问App全面接入淘宝支付宝飞猪高德等阿里系生态业务在全球范围内首次实现点外卖网络购物机票预订等AI购物功能的全量用户开放测试 [3][47] - 用户可通过自然语言指令直接完成商品下单支付结算等全流程操作无需跳转至对应应用同时千问App已接入支付宝政务服务端口上线50项高频民生服务 [3][4][47] - 千问在技术架构上采用了基于MCP与A2A协议的通用Agent体系设计了主Agent与子Agent协同工作的机制以提升跨领域长链路的复杂任务的执行精度与可靠性 [33] - 系统具备持续演进能力可将执行经验结构化为知识库供后续任务参考调用在面对少见任务时可启动AgenticLearning机制利用AI编码能力自主编写测试并封装新的原子工具 [35] AI融资动向 - 2026年1月15日SkildAI完成14亿美元C轮融资由软银领投贝佐斯旗下BezosExpeditions英伟达等参投融资后公司估值突破140亿美元 [2][36] - SkildAI核心业务为开发机器人通用AI基础模型“SkildBrain”采用“硬件无关”架构旨在创建一个可适应各种机器人平台的“通用大脑” [2][36] - 截至2025年SkildAI已实现约3000万美元收入展现强劲增长势头 [2][37] - 2025年全球机器人初创公司共筹集138亿美元超过2024年的78亿美元与2021年的131亿美元 [37] - 上周其他AI初创公司融资动态包括Higgsfield完成0.8亿美元A+轮融资目前估值13亿美元MiniMax上市融资7.04亿美元(55.4亿港元换算)目前估值约115亿美元(898亿港元换算) [39][40] 行情复盘 - 上周(2026年1月12日至1月16日)AI应用指数日涨幅最大值为7.06%日跌幅最大值为-1.93%AI算力指数日涨幅最大值为5.23%日跌幅最大值为-4.05% [41] - AI算力指数内部润泽科技以+14.41%录得上周最大涨幅南兴股份以-14.40%录得上周最大跌幅 [41][44] - AI应用指数内部易点天下以+54.34%录得上周最大涨幅硕贝德以-9.90%录得上周最大跌幅 [41][46] 投资建议与关注公司 - 中长期建议关注加快扩张算力业务的精密零部件龙头迈信林(688685.SH) [4][48] - 建议关注新能源业务高增并供货科尔摩根等全球电机巨头的唯科科技(301196.SZ) [4][48] - 建议关注AI智能文字识别与商业大数据领域巨头的合合信息(688615.SH) [4][48] - 建议关注深耕工业AI与软件并长期服务高端装备等领域头部客户的能科科技(603859.SH) [4][48] - 报告列出了上述四家公司的盈利预测与估值数据 [6][50]
沐曦股份:政企客户系公司的主要客户之一
证券日报· 2026-01-19 22:15
公司产品与客户 - 政企客户是公司主要客户之一 [2] - 公司首款产品曦思N100于2022年推出,面向云端和边端传统AI应用场景的智算推理GPU,提供推理算力和视频编解码能力,可应用于智慧城市、智慧交通、智慧教育、智能视频处理等 [2] - 曦思N系列后续产品如曦思N260、曦思N300(在研)主要面向生成式人工智能下的云端AI推理场景,拥有多精度混合算力,配以大容量显存和新一代高速I/O接口,支持主流深度学习框架,可为内容生成式应用和大语言模型等提供端到端加速服务 [2] 公司信息披露 - 公司将根据相关规定,对达到披露标准的事项及时履行信息披露义务,以保障投资者知情权 [2]
评审用不用AI,作者说了算?ICML 2026全新评审政策出炉
机器之心· 2026-01-19 16:54
ICML 2026征稿与评审机制变化 - 文章核心观点:ICML 2026在征稿中引入了由论文作者决定是否允许在评审过程中使用大语言模型的新机制,这是应对AI工具在学术评审中日益普及的一种折中方案,但该规定的实际执行可能面临困难 [1][3][9][15] 具体政策内容 - ICML 2026为作者提供了两种评审政策选择:政策A为保守型,严格禁止在论文评审中使用任何大语言模型;政策B为宽松型,允许在特定限制下使用大模型进行评审 [4] - 在允许使用大模型评审的政策B下,允许的行为包括:使用大语言模型辅助理解论文内容及相关工作、对评审意见进行语言润色、将投稿论文提交给符合隐私合规要求的大语言模型 [7] - 在允许使用大模型评审的政策B下,明确禁止的行为包括:向大语言模型询问论文的优点或缺点、要求大模型总结或建议评审应关注的关键点、要求大模型提供评审意见的结构或提纲、要求大模型撰写完整的评审意见 [7] - 政策B中提到的隐私合规大语言模型,是指不会使用日志数据进行训练、且对数据保留期限作出限制的模型工具 [8] 政策背景与现状 - 引入该选择机制的原因是过去评审是否使用大模型更多取决于评审人或处于默认接受的灰色状态,而ICML此次将选择权明确交给了作者 [9] - 这一变化发生在论文投稿量持续攀升、评审负担越来越重的现实背景下 [9] - 第三方机构对ICLR 2026的审稿意见统计显示,AI参与审稿已相当普遍:在75800篇论文的审稿意见中,完全由AI生成的占21%,重度由AI编辑的占4%,中度由AI编辑的占9%,轻度由AI编辑的占22%,完全由人类撰写的仅占43% [11] - 有观点认为AI审稿已经达到泛滥的程度,这并非ICML 2026的政策B能够完全限制的 [13] 政策执行与影响 - 关于大模型使用的规定执行起来可能很困难,难以保证审稿人完全遵从限制,例如审稿人使用大模型时很可能第一句话就是违反规定的“给出这篇论文的优缺点” [10][14] - 该套规则或许更像是一种明确态度和方向的约定,而非一套可以严格执行的机制 [15] - 尽管存在执行挑战,但在普遍担心大模型引发信任危机的情况下,ICML为作者提供了可以“一刀切”拒绝大模型审稿的选项,被视为当下一个不错的选择 [16]
获全球首个圆柱电池灯塔工厂认证 亿纬锂能树立智能制造新标杆
证券日报网· 2026-01-19 14:47
核心观点 - 亿纬锂能凭借将人工智能物联网、物理仿真技术、大语言模型等前沿技术与圆柱电池制造深度融合,成功获得全球首个圆柱电池“灯塔工厂”认证,该认证被誉为全球智能制造与数字化的最高标准 [1] 数智化生产体系 - 公司构建了贯穿研产销全链条的数智体系,搭建了国内首条300ppm高速生产线,每分钟可产出300颗圆柱电芯,工厂平均每秒生产近27颗 [2] - 在研发端,物理仿真与AI工艺模型融合实现秒级工艺参数优化,使研发实验次数减少75%,显著缩短了从研发到量产的周期 [2] - 在生产端,关键环节自动化率达100%,物料全程无人配送,AIoT驱动的设备健康预测系统将设备综合效率提升至95% [2] - 在销售端,APS智能排产系统秒级解析全球订单,自动平衡产能与物料,使交期应答时间缩短50% [2] 质量智能管控 - 公司建立起覆盖生产全过程的质量智能管控体系,产品一次合格率在97%以上 [2] - AI生产质量预测模型实时采集全工序数据并进行跨工序动态优化,使电芯电压一致性显著提升70% [2] - AI视觉系统以0.3秒/颗的检测效率,实现从抽样到100%全检的跨越,达成“零漏判”严格质控 [2] - 构建的电池全生命周期数据空间,赋予每颗电池完整数据档案,实现质量问题实时追踪、秒级溯源与闭环改进 [2] 绿色制造与可持续发展 - 公司以数字技术驱动绿色循环发展,实现2022年-2025年生产端单位碳排放下降超60%、单位产品能耗降低超55%的目标 [3] - 部署AI能效最优曲线模型,对核心用能系统进行实时诊断与动态调优,带动系统能耗降低5%-10% [3] - 创新应用“电池护照”,为每颗电池赋予唯一数字身份ID,覆盖产业链超20万个数据节点,为梯次利用与精准回收提供数据基础 [3] - 通过可再生能源利用、再生料应用、节能技术升级等举措,推动产品全生命周期碳足迹降低15% [3] 人机协同与安全管理 - 通过AR实景培训与专家远程指导,将关键岗位技能养成周期从数月压缩至数天,推动产线人员向算法“指挥家”转型 [3] - 工厂部署“360°空天地一体化”安防平台,依托超过1000个智能传感器、无人机、监控设备监测运行,通过AI模型实时预警作业风险,实现生产“零事故” [3] 行业影响与未来展望 - 公司的实践印证了通过前沿技术实现制造效率与绿色绩效双突破的可行路径 [4] - 以自动化和智能化产线、AI智能寻优、电池护照为代表的探索,为新能源产业的高质量与低碳化发展提供了可复制的关键范本 [4] - 随着数字技术与清洁能源制造进一步融合,中国新能源企业将在推动全球能源转型、助力产业链供应链升级、构建零碳未来的进程中扮演愈加关键的角色 [4]
你的论文有novelty吗?复旦搞了个顶会论文查新系统
机器之心· 2026-01-19 11:51
文章核心观点 - 复旦大学NLP团队与WisPaper合作,开发了基于大语言模型的自动化学术论文新颖性分析系统OpenNovelty,旨在通过提供可追溯的文献证据,解决同行评审中对创新性评估的依赖与争议 [2][4] - 该系统通过结构化信息提取、地毯式文献检索、层次化证据比对和生成可验证报告四步流程,为审稿人和作者提供辅助工具,推动可验证、可追溯的新颖性评估 [6][8] - 系统定位为辅助工具而非决策主体,旨在提升评审效率与透明度,但最终学术判断仍需人类完成,其局限性包括对复杂数学内容理解不足、检索范围依赖索引等 [26][27][29] 系统核心设计原则 - 根本原则是任何关于“创新性不足”的判断都必须附带可追溯的真实证据,证据需来自已发表文献并能精确定位到原文具体段落,若未找到证据则如实说明 [7] - 与传统查重关注文字表层不同,系统致力于解决语义层面的重复,通过将作者表述转写为学术概念短句进行结构化抽取 [7] - 采用查询扩展机制,针对提取的每条信息生成多个语义等价变体进行地毯式检索,以防止因单一表述差异导致的检索遗漏 [7] 四步分析流程 - **第一步:核心信息提取**:从论文标题、摘要和引言中精准提取核心任务和若干具体贡献两类信息 [9] - **第二步:相关文献检索与筛选**:基于提取信息自动生成包含同义词的搜索语句,利用WisPaper学术引擎进行地毯式搜索,初步检索可能召回数百至上千篇论文,经过去重、时间过滤与筛除弱相关文献后,形成约60–80篇候选论文集合 [11] - **第三步:层次化分析与证据比对**:基于核心任务召回的候选论文构建层次化分类体系,以定位目标论文在研究脉络中的位置;针对每条贡献声明,在候选论文中进行逐篇对比,并给出“能反驳”、“无法反驳”或“存疑”三种结果,其中“能反驳”必须附带双方论文的原文摘录作为证据 [14][15][17][18] - **第四步:“新颖性调查报告”生成**:整合前三阶段结果,生成包含论文核心任务、研究领域分类体系、每条创新声明的比对结果和证据以及综合新颖性评估叙述的报告 [20][21] 系统部署与公开验证 - 截至1月16日,团队已在系统上分析了1360篇投稿,并将所有生成的新颖性报告公开发布在官方网站,供任何人查阅分析结果、相关文献及判断依据 [24] - 团队计划将分析规模进一步扩展至2000+篇投稿,并持续优化系统,计划将其应用于其他AI顶级会议,并对收集的报告和评审证据进行深入分析 [24] 系统影响与定位 - **对审稿人**:作为辅助工具,帮助梳理文献脉络,快速掌握论文在领域中的位置,从而将更多精力集中于研究意义、方法严谨性等需要人类专业判断的环节 [26] - **对论文作者**:可作为投稿前的自查工具,若研究具备实质创新性可提供相关证据,若漏引重要文献亦能指出问题 [27] - **对学术界**:提供了一种“可验证的新颖性评估”工程路径,用检索到的真实文献与贡献级证据对比来约束结论输出,使判断可被追溯与复核,推动AI成为负责任的知识引证者 [27] - **系统局限性**:难以理解复杂的数学公式和图表;只能检索被索引过的论文,可能错过小众期刊或非英语出版物;“无法反驳”仅表示在检索范围内未找到,不等于确实不存在 [30] - 系统定位为第三方审计系统,旨在清洗迷雾、展示证据,而将最终的价值判断权留给人类审稿人 [31]
在硅谷大厂一路开挂,为啥最终放弃数百万美金年薪?
36氪· 2026-01-19 11:29
核心观点 - 访谈对象朱哲清(Bill)分享了其在Meta的快速晋升经历、斯坦福读博历程以及创业选择,核心观点在于通过选择高成长性项目、有效向上管理并结合对强化学习技术的深刻认知与热情,实现了职业与学业的双重突破,并最终投身于AI智能体创业,旨在利用工具调用技术解放重复性劳动 [1][4][54][57][115][120] 硅谷职场晋升与个人背景 - 朱哲清于1996年出生,在上海长大,高中后赴美留学,本科毕业于杜克大学计算机科学与金融专业,博士毕业于斯坦福大学强化学习专业 [3] - 其职业生涯全部在Meta度过,为期七年半,期间从E3晋升至E7 [4] - 在Meta期间,其团队从零开始搭建商业增长的AI部署,与产品团队共同将广告商增长六倍,为公司带来近10亿美元的营收 [6][7] - 晋升的关键在于选择并做好从0到1、对公司有战略意义且天花板高的项目,同时需要有效的向上管理,让高层看到成果 [10][11][12][13][16][17] - 在Meta的晋升速度(29岁升至E7)被认为是千分之一的概率 [9] 职场发展策略与认知 - 在大公司发展本质上是站位问题,需选择对公司未来发展至关重要的领域或产品线 [31] - 应避免长期从事重复性、无开创意义的工作,这类工作可替代性强,是危险信号 [32] - 对于技术人员,选择取决于专业认知与技术判断力,例如判断LLM或扩散模型中的有前景的技术路径 [39][40][41] - 公司最重要的三个方面是赚钱、用户增长和基础建设,工作若完全不涉及这些方面,天花板会很明显 [36][37] - 向上管理需明确对齐期望,定期用数据复盘,确保沟通无偏差并展示超额完成的结果 [45][46][47][48][49][50][51] 创业动机与公司现状 - 朱哲清于2024年10月底离开Meta创业,创立了Pokee AI,其创业动力源于对强化学习落地应用的长久热情以及认为该技术即将起飞的判断 [54][57][58][63] - 创业方向是打造以工具调用为核心的强化学习智能体,旨在覆盖整个互联网的工具,帮助企业和开发者完成复杂工作流 [4][115][120] - 其认知领先于市场,在2025年初Deepseek证实强化学习方向价值后,获得了大量投资人的关注 [64][65][66] - 离开Meta时其年薪总包约为200万美元 [121] - 目前创业团队有9人,其中5位是从Meta辞职加入的前同事,团队包括负责业务与市场拓展的人员以及工程师和研究员 [123][124] - 其瞄准的AI工作流自动化市场是一个千亿美元级别的市场,目标是用AI逐步接管大公司内部成千上万的重复性工作流程 [125][126] 对AI时代与个人发展的思考 - AI智能体的核心价值在于学会像人类一样调用工具,而非将所有能力内化于单一模型 [116][117][118] - AI的发展将把人类从重复劳动中解放出来,迫使人们思考并转向更有创造力、更高价值的工作 [127][128][129] - 在AI时代,个人的出路在于找到自己的天赋和热爱,利用AI辅助,在细分领域创造比原来好十倍、百倍的产品或服务 [130][131][134][135][136][137] - 当前的AI技术仍存在幻觉、执行复杂指令不准确等问题,距离能够自我设定目标并构成威胁还很远 [140][141] - 未来对大型模型的奖励机制可能需要政府或监管机构介入审查 [143][144][145] 个人经历与驱动力 - 在Meta工作同时攻读斯坦福博士的六年多时间里,每周工作时间超过100小时,牺牲了几乎所有个人生活,动力源于对强化学习落地应用的热爱与执着 [68][69][70][71][77][80][81][82] - 曾经历人生至暗时刻,包括2020年父亲重病需回国照料,同时面临职场晋升受挫(E5升E6失败)以及学业压力,一度感到绝望 [90][91][92][93][94][95][96] - 原生家庭经济不稳定,出国留学是经过精密计算(预算约100万人民币)的理性投资,这种没有退路的环境培养了他的责任感和破釜沉舟的决心 [99][100][101][102][103][104] - 性格从内向转变为外向的关键转折点,是高三时加入一个美国创业团队工作八个月的经历 [109][110][111][112] - 其技术热情与方向选择深受AlphaGo事件影响,并受到如强化学习之父Richard Sutton坚持研究等事迹的激励 [147][148][149][155][156][158]
苹果低下了高傲的头颅
创业邦· 2026-01-19 09:13
文章核心观点 - 苹果与谷歌的合作是一次基于各自战略需求的精准互撩,苹果以每年10亿美元的费用换取谷歌Gemini模型和云技术的使用权,旨在快速提升Siri的AI能力并争取自研时间,而谷歌则借此获得进入苹果高质量生态的入口,以加速其AI模型的优化与市场扩张[6] - 此次合作标志着AI行业竞争重点从单一模型性能比拼转向生态绑定能力的较量,可能重塑行业格局,对OpenAI等竞争对手构成压力[21] - 合作本质上是临时同盟,双方均存在战略保留,苹果意在为自研争取时间并防止对单一供应商形成依赖,未来可能根据自身技术进展调整合作深度[6][24] 苹果的AI困境与战略考量 - **市场与竞争压力**:全球AI手机渗透率预计将从2023年的5%飙升至2027年的54%,而苹果在此浪潮中明显落后[8];Siri用户满意度在2025年第四季度仅为62%,较2023年下降15%,且在“用户最想更换的智能助手”投票中以42%占比高居榜首[10];AI能力不足已影响iPhone销量,2025财年全球智能手机市场份额同比下降2.1%,“AI功能未能满足用户需求”被列为核心原因之一[10] - **技术与人才短板**:苹果自研的最大参数模型仅1500亿,MMLU基准测试成绩78.6%,未达行业第一梯队门槛[8];2024-2025年间,AI团队17名核心成员跳槽至Meta、OpenAI等公司,导致研发进度滞后18个月[8] - **务实选择与风险转移**:自建能支撑1万亿参数模型的AI基础设施需耗资480亿美元且至少需3年,苹果选择以每年10亿美元“租金”方式与谷歌合作,是一次经典的风险转移[10][14];苹果的基因是消费电子和端侧计算,其严格的隐私政策在大模型训练时代成为枷锁,“租”成为最现实的选择[11] - **合作预期收益**:搭载Gemini的新版Siri预计于2026年春季随iOS 26.4推送,支持128K超长文本处理等功能,复杂指令处理速度提升30%以上,响应时间压缩至0.5秒以内[13];预计将带动该系列iPhone销量同比增长11%,季度利润接近400亿美元[13];AI功能升级将提升生态粘性,2025年调研显示65%的苹果用户因“生态协同体验”而继续使用iPhone[13] - **长期自研规划**:借助合作获得的缓冲期,苹果规划在2027年推出1万亿参数的云端模型,目标是在MMLU测试中突破92%的准确率,超越当前Gemini水平[13];内部芯片团队仍在研发下一代NPU,目标是将本地运行模型参数量提升到150亿至200亿级别[24] 谷歌的战略扩张与收益 - **生态入口与高质量数据**:谷歌AI战略的核心难点在于生态入口不足,需要海量真实场景数据优化模型[15];苹果全球超20亿台活跃设备中,iPhone用户占比65%,具备高消费能力、高粘性、高交互频率特点[15];iPhone用户平均每天使用语音助手4.2次,是Android用户的1.8倍,AI功能付费意愿达23%,远高于行业平均的8%[16];接入苹果生态相当于获得13亿高质量测试用户[16] - **市场地位与能力提升**:通过此次合作,Gemini将从“云端工具”转型为13亿iPhone用户的“默认AI引擎”,实现从“需要用户主动打开”到“被动唤醒即可使用”的场景渗透[18];预计到2026年底,Gemini月活跃用户将突破5亿,市场份额提升至25%以上[18];借助iPhone用户数据优化后,Gemini方言识别准确率预计提升15%,复杂指令处理效率提升20%,MMLU测试准确率有望突破95%[18] - **构建全场景生态优势**:Gemini已为三星Galaxy AI提供支撑,覆盖约10亿Android用户,加上iPhone的13亿用户,将形成碾压级优势[20];未来,Gemini可能成为硬件厂商推出AI功能的“首选合作伙伴”,并可将经验复制到智能汽车、智能家居等领域,目标是成为全场景的底层大脑,重新确立垄断地位[20] 行业格局与竞争影响 - **竞争范式转变**:此次合作标志着AI行业从“单一模型性能比拼”转向“生态绑定能力较量”[21];绑定主流硬件生态成为占据主导地位的关键,只懂堆参数而无生态入口的公司可能沦为技术供应商[21] - **对OpenAI的冲击**:随着Gemini成为Siri核心驱动,OpenAI在苹果生态中的战略地位被削弱[21];2025年第四季度,ChatGPT周活跃用户增长已降至5%,若iPhone用户转向Gemini,OpenAI市场份额可能从60.5%下滑至50%以下[21];尽管OpenAI正加速推进新型AI硬件设备以构建独立入口,但难度巨大,可能影响其IPO估值[21] - **合作的非排他性与未来不确定性**:苹果强调与谷歌的合作并非排他性协议,用户仍可通过Siri调用ChatGPT,未来还可能接入其他大模型[23];苹果意在防止谷歌形成垄断性供给,并借合作验证AI场景为自研铺路[24];合作能否长期维持取决于苹果自研突破的时间,若需三年,谷歌有足够时间让Gemini成为AI时代的基础设施,届时苹果自研大模型的市场意义可能减弱[24]
海外科技行业2026年第3期:台积电资本开支激增,OPEN AI广告开始变现
国泰海通证券· 2026-01-18 15:32
报告行业投资评级 - 行业评级:增持 [6] 报告核心观点 - 台积电财报亮眼,3纳米制程需求旺盛且资本开支大幅加码,直接印证了AI需求的长期性和可持续性 [2][6][9] - OpenAI宣布在ChatGPT中引入广告功能,开启商业化破局之路,以应对巨大的盈利压力和基础设施建设投入 [2][6][10] - 三大存储器厂商(三星、SK海力士、美光)计划扩产,但预计产能仍难以满足市场需求,存储超级周期将持续 [2][6][11] 周观点总结 - **台积电业绩与展望**:2025年第四季度,台积电营收337亿美元,环比增长1.9%,毛利率62.3%,环比增长2.8%,均超出指引上限 [6][9] - **台积电制程结构**:3纳米制程收入占比大幅提升至28%,环比增长5%,7纳米及以下先进制程营收占比达到77% [6][9] - **台积电未来指引**:预计2026年第一季度毛利率中枢将进一步提升至64%,未来五年AI服务器收入增速将从40%-50%区间中段提升至50%-60%中高区间 [6][9] - **台积电资本开支**:资本开支计划激增至520-560亿美元,其中70%-80%用于先进制程(2纳米、A16),10%-20%用于先进封装 [6][9] - **OpenAI商业化压力**:ChatGPT月活用户已逼近10亿,但仅有5%的用户支付了20美元/月或更贵的订阅费用,2025年上半年亏损高达80亿美元,未来5年基础设施投入预计超过1万亿美元 [6][10] - **OpenAI广告策略**:将在免费版和入门订阅级中引入交互性广告,旨在转化95%的免费用户价值,并强调广告不会干扰回答的客观性 [6][10] - **存储器厂商扩产计划**:2026年,三星DRAM产量预计提高至800万片晶圆,同比增长5%;SK海力士DRAM产量预计增长约8%至约648万片;美光年产量预计约为360万片,与2025年持平 [6][11] - **存储器市场判断**:尽管三大厂商产能有所提高,但与市场需求之间仍存在巨大缺口,存储超级周期预计将持续 [6][11] 一周行情回顾总结 - **大盘指数表现**:在2026年1月10日至1月17日期间,恒生指数上涨2.34%,恒生科技指数上涨2.37%,道琼斯工业指数下跌0.29%,纳斯达克指数下跌0.66% [12][13][14] - **板块指数表现**:同期,恒生互联网科技业指数上涨3.73%,HK网络游戏指数上涨3.65%,HK AIGC概念指数大幅上涨21.97%,纳斯达克中国金龙指数上涨0.32% [14][15] - **港股个股表现**:哔哩哔哩-W周涨幅16.4%,阿里巴巴-W周涨幅13.4%,阅文集团周涨幅7.4% [17][18] - **美股个股表现**:1药网周涨幅83.4%,超微半导体(AMD)周涨幅14.1%,极光周涨幅12.5% [17][22] AI行业要闻总结 - **SK海力士技术突破**:宣布推出5-Bit NAND闪存技术,相比传统PLC闪存读取速度快了20倍,能更好满足AI训练与推理对高速大容量存储的需求 [24] - **科技巨头IPO动态**:Anthropic、OpenAI和SpaceX同步启动IPO计划,估值预计分别达3500亿美元、5000-7500亿美元和8000亿-1万亿美元 [24] - **大模型技术演进**:Deepseek提出Engram条件记忆模块,旨在通过“计算+记忆”的架构降低大模型推理成本,特别适合长文本处理 [25] - **OpenAI业务扩张**:以约1亿美元收购AI医疗初创公司Torch,并确认其硬件项目首款产品为代号“Sweetpea”的AI音频设备,向软硬件一体化转型 [25] - **移动AI生态合作**:苹果与谷歌达成协议,将在2026年推出的新一代Siri中采用谷歌的Gemini AI模型,以弥补自身AI技术短板 [26] 投资建议总结 - **算力方向**:推荐英伟达(NVDA.O)、台积电(TSM.N)、阿斯麦(ASML.O)、博通(AVGO.O)、迈威尔(MRVL.O) [26][28] - **云厂商方向**:推荐微软(MSFT.O)、亚马逊(AMZN.O)、谷歌(GOOGL.O) [26][28][30] - **AI应用方向**:推荐AI Agent方向受益的苹果(AAPL.O)、高通(QCOM.O)、联想集团(0992.HK)、小米集团(1810.HK),以及Physical AI方向受益的特斯拉(TSLA.O) [26][28][30] - **AI社交方向**:推荐腾讯控股(0700.HK)、Meta(META.O)、谷歌(GOOGL.O) [27][28][30]
预期理想的纯软的大语言模型在较长一段时间都无法国内前三
理想TOP2· 2026-01-17 20:08
公司大语言模型目标与现状 - 公司创始人李想在2024年12月的AI Talk中提出,要求团队在未来几年必须保证大语言模型的基座模型能力在中国范围内达到行业前三,并承诺投入所需训练算力 [2] - 该目标被具体分解为从10名开外先进入前五,再从第五进入第三的跟随策略,但此后创始人未在公开场合重复提及此目标 [1][2] - 以2024年12月27日发布的手机版“理想同学”应用框架为判断依据,公司当时不具备实现该目标的能力 [1][2][3] 大语言模型领域竞争格局 - 公司在大语言模型基座能力方面的主要潜在竞争对手包括豆包、DeepSeek、Qwen、Kimi,2025年需直接超越其中两家,挑战巨大 [1][3] - 至2026年1月17日,竞争对手名单中还需加入MiniMax,公司在纯软件大语言模型领域超越这五家公司中的三家难度非常大 [1][3] - 其中超越DeepSeek被认为是最困难的,其优势源于创始团队在高原创度、有业界影响力的论文及可验证的科学工程化成果方面的深厚认知 [3] 公司在具身智能领域的机遇 - 在具身智能(AI控制现实物理硬件)领域,公司拥有冲击国内前三乃至榜首的潜力 [1][4] - 公司被归类为“全栈闭环AI软硬结合派”,与特斯拉、苹果模式类似,主张算法定义硬件,追求系统极致效率 [4][6] - 该潜力能否实现并非必然,高度依赖于行业自身发展以及创始人李想的学习进化速度与决策执行质量 [1][4][6] 创始人认知与公司战略演进 - 创始人李想对AI的认知在近几年内飞速成长,被业界人士评价为“学习进化的机器” [7][8] - 公司的发展节奏借鉴了创始人早年经营汽车之家的经验,即通过明确目标、快速迭代实现排名跃升(如从100名外进入前五,再至第一) [6] - 然而,在大语言模型进入前三的目标上,公司未能复刻汽车之家的成功节奏,表明最前沿的大语言模型竞争对创始人认知要求极高 [6] - 外部观察显示,创始人从2024年初对AI“理解不足够深刻”,到2024年底被认为是“国内车企一把手里最懂AI的”,认知迭代迅速 [8] 公司技术进展与战略决心 - 2025年6月,公司的VLA(视觉语言动作)模型创新度被评价为DeepSeek MoE水平,低于DeepSeek MLA的创新水平 [8] - 2025年10月,有证据表明公司智驾技术是参考而非简单跟随特斯拉 [8] - 2026年1月的人事调整被视作公司在具身智能战略上动真格的标志 [8] - 创始人描绘的远期愿景是实现类似《钢铁侠》中Jarvis的能力,若实现则意味着其大语言模型能力将非常强大,但这将是远期目标 [1]
2025年中国AI+互联网媒体行业研究报告
艾瑞咨询· 2026-01-17 08:03
研究核心观点 - AI技术是驱动互联网媒体产业升级的核心引擎,正在深刻变革内容生产、传播和商业模式 [1] - 生成式AI技术正在重构互联网媒体内容生态全链路,推动行业从信息中介转向智能服务枢纽 [2] - 行业正从用户规模增长的增量竞争,转向存量市场的质量与效率竞争 [2][6] - 技术发展面临信息真实性、视频生成效果、成本及隐私等挑战,但也带来人机协同、生态升级等机遇 [3] 行业发展概况 - 互联网媒体行业历经五个阶段跃迁:门户时代、图文时代、图文+音/视频时代、长短视频+直播时代,现已进入大模型技术赋能的多模态时代 [4][23] - 技术迭代是行业变革的核心驱动力,推动媒介形态从单向传播向沉浸式、个性化、智能化的生态融合演进 [4] - 中国互联网用户规模增长红利见顶:网民规模从2014年的6.49亿增至2025年H1的11.2亿,普及率达79.7% [6] - 中国移动互联网设备规模达14.4亿台,网民人均每周上网时长为30.6小时,数字生活渗透趋近饱和,竞争进入存量精耕阶段 [6] 人工智能技术发展 - 人工智能技术演进呈现从符号逻辑到数据驱动、从专用模型到通用智能的螺旋式上升轨迹,现已迈入生成式AI驱动的应用落地爆发时代 [9][10] - 大语言模型技术成熟度高:Transformer架构和“预训练-微调”范式成为行业标准,混合专家、检索增强生成、思维链等前沿技术推动其成为趋近人类思维的智能决策者 [11] - 多模态大模型处于多技术融合进程:生成向的DiT架构与理解向的MLLM架构并行发展,但尚未实现底层能力有效融合,整合不同模态的生成和理解是关键方向 [13] - 生成式AI应用在多领域爆发式落地:文本生成已进入商业化成熟期,图像生成实现规模化应用,音频生成在垂直场景中应用,视频生成因Sora等模型突破进入爆发前夜 [16] - 2025年大语言模型产业呈现三大特征:架构趋同(MoE成为主流)、能力分化(构建专业化模型矩阵)、全模态演进(处理多模态成为标配),产业价值向场景化应用层转移 [18] AI对互联网媒体的赋能 内容生产 - AI技术重构创作生态,通过语义理解与多模态生成技术,将文字指令转化为图文、视频等多元形态,推动全民内容创作 [24] - 中国11亿网民均可能参与多模态内容创作,凸显全民创作趋势 [24] 内容审核 - 生成式AI从自动审核、精准判定、人机互补、动态策略四大方面革新审核体系 [26] - 通过多模态模型实现自动化初筛,语义分析与情感识别提升复杂违规内容判定准确性,人机协同形成互补闭环 [26] 内容分发与平台运营 - AI技术通过深度解析用户行为、设备、场景等多维度数据,优化推荐路径,实现精准实时推荐与多模态场景适配,提升分发效率 [28] - 在用户运营环节,通过精准内容匹配、智能客服等延长用户停留时长,强化粘性 [28] - 在商业拓展层面,可优化广告个性化生成与精准投放,并开拓内容定制、创意广告服务等新商业形态 [28] 内容消费 - 打破信息触达壁垒,通过多语言翻译、文本语音互转等技术实现无障碍内容获取 [31] - 重构交互范式,以智能摘要、对话式咨询等服务实现从浅层浏览到深度探索的升级 [31] - 基于动态用户画像的精准推荐系统形成千人千面的伴随式体验,并借助兴趣图谱拓展用户认知边界 [31] - 通过AI辅助创作工具降低UGC门槛,使消费者向“产消者”转型,形成创作-消费-再创作的产消价值循环 [31] 标杆平台案例实践 中央媒体:人民日报 - 运用生成式AI技术提升视频内容创作效率,推出创意混剪作品 [36] - 推出“两会AI学习”专栏,采用多民族数字主持人播报新闻 [36] - 依托“创作大脑”AI+全息采录眼镜等设备,助力记者实现“一镜到底”的全媒体采编流程 [36] - 客户端累计下载量突破2.9亿次,微博粉丝超1.55亿,微信公众号订阅量达5737万,抖音关注数达1.74亿 [36] 地方媒体:澎湃新闻 - 系统性整合AI创作工具,形成派生万物AI办公、视觉与视频三大工作室,提升内容生产效率 [38][39] - 清穹内容风控智能平台嵌入生成式AI工作流,提供智能审核、智能校对、智能巡检、舆情监测、增值服务五大核心功能 [38][39] 短视频媒体:抖音 - 以豆包大模型为核心技术底座,将AIGC技术深度嵌入“内容生产-处理剪辑-发布呈现-营销传播”全生命周期环节 [40] - 豆包大模型1.6版本于2025年6月发布,包括视频生成、语音播客等多样化模型技术矩阵,支持深度思考、多模态理解、256k长上下文等能力 [40] 大众社交媒体:微博 - 以自研多模态知微大模型为技术底座,构建AI+产品矩阵,实现内容生态全链路智能化升级 [42] - 智搜产品结合知微大模型、DeepSeek-R1及多模态RAG技术,自动整理新闻事件要素,帮助用户“秒懂热点”,截至2025年6月月活跃用户已突破5000万 [44] AI时代行业挑战 信息真实性 - 生成式AI技术可能被用于炮制虚假新闻、伪造影像,冲击社会信任体系 [46] - 低质量算法生成内容易导致认知偏差,监管面临技术迭代与风险防控双重压力 [46] - 行业防御措施包括:平台自研大模型实现跨模态审核、建立内容溯源与可信度评级、对AI生成内容实施显式标识 [46] 视觉效果 - AI视频生成技术在物理逻辑一致性、角色身份连贯性及艺术细节控制上存在局限,构成商业化应用核心瓶颈 [49] - 当前AI视频更多停留在创意辅助和短内容测试阶段,无法满足影视级标准 [49] - 行业采取人机协同混合工作流,由AI生成草稿,人类专家完成最终艺术打磨 [49] 技术成本 - 算力、数据和人才等要素的巨额投入构筑了极高准入门槛,AI竞赛呈现巨头游戏态势 [51] - 高昂成本阻碍技术普惠,让众多媒体平台面临用不起、不敢用的困境 [51] - 行业优化路径包括:拥抱开源生态利用MaaS服务API降低门槛,以及有实力的平台投资构建自有垂直领域模型以构筑壁垒 [51] 安全隐私 - 个性化推荐与内容生成依赖海量用户数据,引发数据滥用、算法偏见、信息茧房及隐私泄露风险 [54] - 平台承受着遵守严格数据法规与维护用户信任的双重压力 [54] - 行业构建以信任为核心的治理框架:贯彻隐私始于设计原则、应用联邦学习等隐私增强技术、赋予用户数据控制权、设立AI伦理委员会监督 [54]