多模态
搜索文档
多模态商业化落地加速,关注恒生科技ETF易方达(513010)、港股通互联网ETF易方达(513040)投资价值
每日经济新闻· 2026-02-09 16:42
多模态模型与应用端进展 - 近期国内多模态模型与应用端进展持续提速,以视频生成领域为代表 [1] - Seedance2.0在一致性、可控性及音画同步等核心能力上实现明显突破,并在多镜头叙事与自动分镜方面迈向工业级应用 [1] - 可灵3.0通过多模态一体化与长视频能力,验证了复杂创作场景下的稳定输出能力 [1] AI应用商业化进展 - AI应用商业化进展正不断加快,除模型进展外,头部AI视频产品收入持续改善 [1] - 可灵产品在12月收入超2000万美元,新版本带动流水环比提升 [1] - 国产多模态模型在能力与商业化上的同步推进,正在重塑内容生产效率与行业供给结构 [1] 港股科技板块投资价值 - 国产多模态模型的进展在估值处于历史相对低位的背景下,进一步强化港股科技板块的中长期配置价值 [1] - 恒生科技指数由港股上市公司中与科技主题高度相关的、市值最大的30只股票组成,聚焦港股科技核心资产 [1] - 中证港股通互联网指数聚焦港股互联网平台公司,汇聚中国AI核心企业 [1] - 两只指数的滚动市盈率均在25倍以下,分别位于指数发布以来24.3%和20.8%分位处 [1] 相关ETF资金流向 - 恒生科技ETF易方达(513010)上周净流入额为18亿元 [2] - 港股通互联网ETF易方达(513040)上周净流入额为6亿元 [2] - 看好AI应用未来发展的投资者可通过以上产品一键布局行业龙头 [2]
中信建投:自主Agent发展迅速,多模态催化内容市场迭代
新浪财经· 2026-02-09 14:24
行业核心观点 - 人工智能行业在模型能力、多模态应用及垂直场景渗透方面取得显著进展,多家公司发布重要产品更新,推动技术向更复杂、更自动化的方向发展 [1] Anthropic (Claude Opus 4.6) - 发布Claude Opus 4.6,凭借Agent Teams机制与自适应思考能力,深度打通Office生态并实现复杂工程任务托管 [1] - 该产品推动AI在金融、法律等垂直场景的深度渗透 [1] OpenAI (GPT-5.3-Codex) - 推出GPT-5.3-Codex,刷新编程与终端操作的SOTA(State-Of-The-Art)水平 [1] - 产品通过端侧环境接管与自我构建能力,验证了AI自动化研发的内生循环 [1] 字节跳动 (多模态领域) - 字节跳动Seedance 2.0开启内测,通过全方位多模态参考与精细化镜头控制解决视频生成的一致性痛点 [1] - 该产品有望协同Doubao、Seedream构成全模态矩阵,大幅降低内容制作成本并加速商业化落地 [1]
中国AI?美国AI?
36氪· 2026-02-08 15:56
中国AI视频模型竞争格局 - 字节跳动发布新一代视频生成模型Seedance 2.0,该模型完全改写了视频生成方法,更侧重于运镜、理解、模仿、转场等效果,极大利好短视频创作者生态[3] - 快手发布新一代视频生成模型Kling 3.0,该模型更偏向于影视化、真实化和工业化的能力,目标用户是专业导演和工作室[3] - 两个模型的综合能力均对标视频大模型的Sota(谷歌Veo模型),但技术路线存在差异[3] - 博主和用户对侧重短视频创作的Seedance 2.0更有感觉,但对Kling 3.0的上限期待很高,认为其在抹平真实与虚拟的界限[4] - 从长期看,技术路线差异是暂时的,最终目标都是解决“抽卡”问题,并全方位替代现有视频生产管线的一半以上[4] 全球AI视频模型发展趋势 - 2026年,视频模型成为AI竞争主战场,除字节和快手外,马斯克发布Grok专有视频模型Imagine 1.0,谷歌发布Genie 3[6] - 视频信息量远超文本和语言,此前视频模型因能力不足、训练难度高、生成质量不稳定而受限,但到2026年该瓶颈期即将被跨越[6] - 多模态AI(尤其是视频)是AI接近普通人的破圈手段,去年ChatGPT和Gemini的两次“翻倍级”增长均得益于多模态能力[4] 中美AI产业发展路径差异 - 美国AI巨头重点发力AI Coding,其终点是工具、软件甚至系统的零成本化,这导致美股SaaS(软件即服务)赛道突然崩盘[7] - SaaS是一个积累了近30年、规模达万亿级的市场,AI对其的替代想象空间巨大[7] - 中国AI公司在产业化方面面临挑战,原因在于难以替代一个不存在的市场、拿走不存在的产值[9] - 但在多模态尤其是视频模型领域,中国拥有全球领先的短视频、直播和创作者生态,存在巨大的市场、产值和故事可供AI承接,因此字节和快手在视频模型上的投入动力不虚美国大厂[9] 主要公司动态与战略 - 快手Kling模型有先发优势,ARR(年度经常性收入)增长很快,在海外处于第一梯队[10] - 字节跳动属于后来居上,其多模态能力对豆包App的留存率拉动明显,且GPU储备量是国内大厂中的顶级水平[10] - 字节跳动内部期待AI业务能跑出“下一个抖音”,并已启动赛马机制,至少有三股势力在竞争[13] - **即梦**:负责人张楠(抖音创始人)被安放在从0到1的最前线,代表字节最强的创业战斗力[13] - **豆包**:所属Flow团队负责人朱骏是Musical.ly创始人,已成功两次,属于最正统的继承位[13] - **抖音部门**:希望由自己孵化“下一个抖音”,例如抖音搜索团队已开发名为“AI抖音”的App[13] - 字节跳动公司活力高、欲望强,在大厂中很少见,看不到老化痕迹[13] 行业影响与未来展望 - 视频模型的成熟将全方位替代现有视频生产管线的一半以上[4] - 中国AI公司在本月还有重量级发布,行业将进入“神仙打架”的阶段[14]
2026 AI年度展望:关于「大公司、独角兽、创业者」的十条趋势判断
新浪财经· 2026-02-07 21:43
2026年中国AI市场竞争格局 - 2026年是中国AI ToC市场大厂进行最后一搏的关键窗口期,竞争激烈程度不亚于历史上的打车、支付等大战 [2][58] - 字节跳动凭借豆包已占据AI to C一线位置,手握最大流量,其推出的豆包手机是对边界的试探 [2][58] - 阿里巴巴对“千问”进行战略级投入,2026年将更加淋漓尽致,例如投入30亿人民币进行市场推广 [2][58] - 腾讯同样会采取大动作,大撒“元宝红包”仅是开始 [2][58] - 对于“AI六小虎”(如智谱、MiniMax、月之暗面、阶跃星辰等)而言,随着部分公司完成港股IPO或大额融资,故事告一段落,自我造血和寻找差异化商业化道路迫在眉睫 [3][58][59] 主要科技公司战略与挑战 字节跳动 - 豆包的核心决策是早期确认多模态为核心能力,实现了AI能力平权,并在2025年抓住了最佳增长时机 [8][64] - 2025年通过引进以吴永辉为代表的世界顶尖人才,完成了顶尖模型人才储备,基础模型层稳居国内第一梯队 [8][64] - 2026年面临的核心挑战是如何在激烈竞争中留住顶尖人才 [8][64] - 长期挑战在于如何保持AI模型能力领先,并将AI助手与电商、外卖等线下服务联动,尽管公司组织年轻有活力,但内部协同仍是难题 [8][66] 阿里巴巴 - 千问是阿里集全集团之力打造的C端AI入口,产品路线从差异化的办事、办公场景切入,走专业路线,长期目标是成为AI入口 [10][69] - 千问未来不仅是对外AI入口,也将为阿里内部众多业务提供底层AI能力平台 [10][69] - 2026年的挑战在于,阿里业务体系庞杂,千问作为独立技术团队,理解并协同各业务单元对AI能力的诉求存在困难 [10][69] - 阿里通过组织变革(如成立千问C端事业群)来换取决策速度,以抓住AI助手可能成为新流量入口的短暂机会窗口 [11][70] - 行业观点认为,2026年将是大厂真正开打“ChatGPT之战”的一年,虽然市场已有DAU过亿的产品,但市场远未饱和 [10][69] 腾讯 - 元宝早期就明确了“模型即产品”的重要性,接入DeepSeek后强化了这一共识,2025年聚焦于提升模型能力及产品与模型的深度整合 [15][73] - 元宝选择聚焦高知人群走差异化路线,旨在利用其意见领袖效应形成示范 [15][73] - 截至2025年底,元宝的搜索服务部分基于混元,部分基于DeepSeek,但大多数用户仍选择DeepSeek作为默认模型,公司需摆脱对DeepSeek的依赖 [15][73] - 近期TEG搜推部门与元宝搜推合并,旨在提高效率并整合搜索链路,未来可能只存在统一的“元宝搜索” [15][74] - 腾讯整体节奏相对谨慎,混元策略可能避开基础模型正面竞争,聚焦Agent等差异化方向,2026年关键是要理清微信与元宝的战略定位 [16][17][75] 百度 - 百度认为AI正开启“超级周期”,其价值将远超互联网时代,将深度重构“研产销服”全产业链,撬动10万亿级市场 [18][77] - 智能体(Agent)被视为产业落地的关键形态,企业需构建AI原生组织,未来可能形成“决策层+智能体”的高效架构,中层可能大幅缩减 [18][77] - 百度指出当前AI产品存在三大痛点:认知偏差与幻觉问题、落地断层(手脑分离)、体验割裂 [18][78] - 百度致力于将百度文库和百度网盘打造为“超级个人智能体”,以解决上述痛点 [19][79] - 在数字人领域,百度将其发展分为三个阶段,并率先发布高说服力数字人进入3.0阶段,未来数字人将能持续自主进化并在更多场景超越真人 [20][21][80][82] 商业模式探索与分化 - 大模型主流商业模式有五种:ToC订阅和广告付费、ToB的API售卖、ToB/ToG定制化、按效果付费、软硬件一体 [4][25][60][85] - 选择ToC订阅模式的厂商基本都选择出海,因国内用户付费意愿不高 [25][85] - 售卖API的模式本质是云服务延伸,未来云厂商会将价格压得很低,独立模型厂商难规模化,故API只能作为短期商业化补充手段 [25][85] - 定制化模式在国内不仅需要技术交付能力,人脉也很重要 [25][85] - 按效果付费和软硬一体对初创公司有机会,但都对能力提出高要求:按效果付费需模型能力足够强,软硬一体需多模态模型矩阵和端云协同交付经验 [25][85] - 2023年以来许多模型公司有“OpenAI病”,但到2025年,因资源(钱和卡)有限,更多公司转向学习Anthropic,聚焦推理和Coding等有付费市场的方向 [25][26][86] - 目前没有商业模式是成熟的,仍需几年探索,产品形态也未定型,例如OpenAI也在探索ChatGPT采用广告模式的可能性 [4][27][60][86][87] 创业公司机会与策略 - 创业公司应寻找垂直场景切入,做端到端的服务交付,而非工具 [31][91][92] - 应聚焦信息生产场景,而非娱乐、社交等消费场景,后者是大厂必争之地 [31][92] - 创业公司相较于大厂有两个优势:技术更垂直深入、可以保持技术独立性(因部分场景客户与大厂存在竞争或数据安全顾虑) [32][33][93] - 2026年被认为是Agent“按效果付费”的元年,经济模型将从“订阅费覆盖算力成本”转向“任务分成覆盖算力成本”,这能帮助用户低门槛赚钱,传播速度快 [33][94] 融资与上市环境 - 2026年初,月之暗面、阶跃星辰获得新一轮大额融资,证明一级市场仍能支撑大模型发展 [39][100] - 此前智谱、MiniMax的港股IPO向市场释放了信号,但走向二级市场是“双刃剑”:带来融资渠道和市场声量,但也立即面临商业化压力和股价审视 [3][39][59][100][101] - 港股IPO越友好、上市公司越多,越能改善一级市场环境,为优质科技企业提供更顺畅的退出渠道和国际公允定价,反哺创新 [37][38][98] - 创业者应致力于全球创新而非区域创新,只要坚持创新,资本(包括海外资本)会主动进入,例如2025年DeepSeek和宇树的案例 [38][39][99] AI组织形态与效率 - AI时代,极小团队组织形式与全栈创新能力相辅相成,大公司中的AI研发团队也有必要简化以避免沟通瓶颈 [42][104] - 称职的极小团队创始人需具备三种核心能力:找机会(深挖行业痛点)、快速执行力(借助AI快速出Demo)、自我营销(利用社交媒体获客与验证) [42][104] - 在AI研发组织中,算法和基础设施(Infra)团队不应截然分开,强调分工易导致创新空间丧失和底层感知缺失,应共同设计、协同演进 [42][43][105] - 不应迷信一人公司,组织的关键评价维度是“人效”,公司80%的成本是沟通成本,AI可帮助规避此隐形成本 [43][44][105] - 一些头部AI公司已用AI进行内部分工,例如用Claude识别员工技能并分派任务,未来更需要具备批判性思维的通才来减少人际沟通问题 [44][105][106] 基础模型技术发展趋势 - 多模态需要走向“大一统”,即将图文、音视频等模态的理解与生成混合在一个模型中,以获得更强的上下文学习和零样本学习能力,天花板更高 [47][110][111] - AI时代真正的壁垒是“记忆”,这是所有AI产品的兵家必争之地,衡量指标应从DAU转向DTU(每日交流用户)和LMU(长记忆用户) [47][48][111][112] - 模型落地存在鸿沟,因中心化大模型缺乏高精尖领域或机构的私有数据,未来趋势是“去中心化”,通过提供低成本、易用的“脚手架”让各机构部署本地化模型,并通过模型融合构建领域基础模型 [48][49][112][113][114] 具身智能与世界模型 - 世界模型要真正有效,必须与下游场景形成验证闭环,例如商汤用上汽智己的实车检验其智能驾驶世界模型,大晓机器人用四足狗在巡逻任务中迭代模型 [52][118] - 预测物理世界的“ChatGPT时刻”可能在2-3年内到来,其定义为在100种常见任务中,90%的场景下达到95%的成功率,需VLA、世界模型和强化学习互相配合 [53][119] - 世界模型不同于数据驱动的VLA,它需要靠算法建模物理世界运动规律,让机器人能预知未来动作后果,是适合前沿实验室探索的方向 [53][54][119][120]
结构分化,重点关注AI及盈利兑现度:2026年港股互联网&科技策略前瞻
国海证券· 2026-02-06 09:43
核心观点 - 2026年港股互联网与科技板块将呈现“结构分化”的特征,市场表现预计为指数强、结构分化、龙头集中度提升,投资回报将更多依赖于盈利和科技业务的兑现,而非流动性溢价 [4][5][21] - 整体看好恒生科技板块,主要基于估值仍处低位、流动性环境改善以及人工智能带来的估值重塑三大逻辑 [4][9][66] - 生成式人工智能是新一轮科技竞争与行业增长的核心驱动力,龙头互联网公司凭借在算力、算法、应用和资本开支上的综合优势,是推动AI估值重塑的中坚力量 [4][6][33] 估值角度 - 2025年初以来,恒生科技板块估值持续回升,主要受以AI大模型为核心的新一轮科技竞争驱动,特别是DeepSeek开源及模型普惠化改善了商业化投资回报率,推动国产AI估值重塑 [4][9] - 截至2025年12月31日,恒生科技指数市盈率(PE-TTM)为20.05倍,处于2022年以来历史均值以下0.77倍标准差;市销率(PS-TTM)为1.99倍,处于历史均值以上0.2倍标准差,显示估值具备性价比 [4][9] - 当前恒生AH股溢价指数为123.46,位于历史均值(193.92)以下2.02倍标准差,A/H溢价处于低位 [9][10] 资金角度 - 2025年以来南向资金持续加速流入港股,在消费、科技、医药等板块的配置占比同比明显提升 [5][13][14] - 主要互联网公司港股通持股比例在2025年均显著提升:腾讯控股从年初的10.1%提升至11%;快手从11.61%提升至16.64%;美团从10.4%上升至20.76%;金蝶国际从24.22%上升至28.22% [5][15][18] - 2026年海外流动性可能呈现“上半年更宽松、下半年不确定性上升”的节奏,美联储保险式降息主要集中在上半年,流动性更可能支撑核心资产估值下限,市场资金将更关注盈利兑现 [5][19][21] 互联网行业趋势与AI战略 - 中国互联网整体用户流量已趋于稳定,但生成式AI应用(APP及PC/网站端)的用户体量已形成规模,流量增长强劲,成为新的流量红利 [6][22][28] - 人工智能已成为互联网龙头公司的战略性方向,大厂在模型、芯片、推荐算法到落地能力上全面布局,并全面加码资本开支:预计阿里巴巴(FY2026)、字节跳动(CY2025)、腾讯(CY2025)的资本开支将分别达到1252亿、1600亿和863亿元人民币 [6][33][35] - 国内龙头公司在AI大模型竞赛中表现突出:阿里的文本基座模型Qwen3 max位列国内榜单第一;腾讯的混元3D模型处于全球第一梯队;快手的可灵o1多模态模型在国内视频模型榜单排名第一 [6][33][46] AI应用落地与变现前景 - AI+广告是AI商业化落地的重要渠道,能显著提升广告投放效率与效果,海外龙头如谷歌、Meta已验证其赋能价值,国内腾讯、阿里、快手等厂商也正全面渗透 [6][41][42] - AI智能体(Agent)在2026年有望加速落地,带来流量入口价值重塑:腾讯计划构建以小程序为核心的“微信原生Agent”;阿里计划以千问为智能中枢打造“一站式生活服务Agent”;字节跳动通过Coze平台和豆包助手推动端侧AI Agent落地 [6][43][44] - 多模态AI是未来重要潜力方向,应用场景广阔,涵盖影视短片、商业广告、电商营销、教育、游戏娱乐等,国内厂商如字节跳动、腾讯、快手等在相关模型排行榜上表现强势 [46][47] - 海外龙头谷歌展示了资本开支投入与AI产出的正向循环:其2025年资本开支预计达910-930亿美元,模型能力全球领先,云端业务增长强劲,并与Anthropic达成价值超500亿美元的百万片TPU订单 [6][37][38] 智能驾驶与机器人出租车 - 看好具身智能方向,智能驾驶从算法到芯片均在加速落地:小鹏汽车计划在2026年第一季度发布VLA2.0系统,可实现从视觉到动作的直接输出;国产高阶智驾芯片(如地平线J6P)的落地有望推动供应商实现“量价齐升” [6][50][53] - 机器人出租车(Robotaxi)赛道的头部玩家单位经济模型(UE)已转正,商业化路径逐步被验证:小马智行第七代Robotaxi实现了以城市为单位的单车盈利,计划2026年将规模扩至3000台以上;文远知行在阿布扎比获得商业化牌照;小鹏汽车也计划在2026年推出Robotaxi车型 [54][57] 消费电子行业 - 2026年消费电子市场面临需求疲软与存储芯片涨价的挑战:IDC预计2026年中国智能手机出货量同比下降2.2%,Omdia预计中国PC出货量同比下降2%,存储涨价可能侵蚀供应链利润并加速行业洗牌 [58] - 投资应聚焦高利润赛道与新兴应用:高端市场(如苹果供应链)盈利稳健;折叠机、AI手机、AI眼镜等新兴需求成长空间广阔,IDC预计2026年全球折叠屏出货量同比增长超30%,中国新一代AI手机出货量将达1.47亿台(同比增长31.6%),全球智能眼镜出货量将突破2368.7万台 [59][60][62][63] 重点公司盈利预测与估值 - 报告列出了覆盖公司的详细盈利预测与估值倍数(基于2026年预期),例如:腾讯控股预计2026年营收8472.21亿元(同比增长12%),经调整净利润2990.30亿元(同比增长15%),对应市盈率17.0倍;阿里巴巴预计2026年营收11677.16亿元(同比增长12%),经调整净利润1699.56亿元(同比增长61%),对应市盈率15.2倍 [66]
如何看待目前的计算机与AI应用
2026-02-05 10:21
纪要涉及的行业或公司 * **行业**:计算机与人工智能(AI)应用行业,涵盖AI软件、应用、硬件基础设施、云计算、网络服务(CDN)及多模态内容(如短剧、漫剧)[1] * **公司**: * **国外公司**:AbbVie、Palantir、Salesforce[1][3][4][5] * **国内AI应用/计算机公司**:科大讯飞、深信服、海康威视、福昕软件、金蝶、中控技术、卓翼信息、智谱科技、兆驰股份、万兴科技[1][6][9][10][12] * **国内大型科技公司**:字节跳动、阿里巴巴、腾讯、Minimax[1][7][11] * **云计算/网络服务公司**:深信服、优刻得、青云科技、网宿科技[3][11][14] * **大型互联网公司生态链公司**:汉得信息(字节跳动链)、光云科技、石基信息、杰盛科技(阿里巴巴链)、泛微网络、博思软件(腾讯链)[13] 核心观点和论据 * **AI应用与硬件股价分化原因**:分化始于2025年,主要源于公司业绩表现和市场指引差异,以及对“AI吞噬软件”的担忧[3] 例如,AbbVie在2025年第三季度营收增长68%,调整后净利率达82%,但市值从高点下跌了40%[1][3] Palantir第四季度营收14.1亿美元,同比增长70%,调整后净利润率达57%,但其海外B端收入仅增长8%,导致市场预期分化[1][4] * **AI应用公司面临的挑战**:国内外AI应用公司主业均受压制,传统业务增速放缓或内需不足[5] 例如,Salesforce在2025年股价接近腰斩,其第三季度营收仅增长8.3%,第四季度收入指引为11%-12%[5] 其AI年度经常性收入(ARR)达14亿美元,同比增长114%,但仅占公司未来12个月预期收入的2%[5] 国内头部AI应用公司2025年AI收入占比约5%,预计2026年可能提升至10%-20%[5] 公司经营状况显著改善是估值和每股收益(EPS)修复的关键[1][5] * **2026年为AI应用与智能代理(Agent)元年**:因技术突破使得AI应用大规模落地,已有Claude Bot等划时代产品面世,且7×24小时长时运行的智能代理技术已成熟[2] * **国内计算机行业基本面改善**:根据申万计算机指数,238家发布业绩预告的公司中,36%预计净利润为正,60%以上预计净利润增长[6] 头部企业如科大讯飞、深信服、海康威视、福昕软件等表现良好,金蝶成功扭亏[6] 基本面的改善有助于企业更快拥抱并布局AI[1][6] 中控技术等公司通过股权激励计划展示发展信心[1][6] * **大型科技公司加速AI生态竞争**:字节跳动、阿里巴巴和腾讯均加大AI投入,竞争加剧[1][7] 字节跳动通过火山引擎成为春晚合作伙伴并上线互动玩法[7] 阿里巴巴发布千问6.0版本并计划整合支付宝、淘宝等生态[7] 腾讯招募顶尖AI科学家并加大人才和营销投入[7] 春节成为生态战和入口战的开端,需关注各家公司利用此契机推广AI产品的策略[8] * **投资者应关注的投资方向**: * **主线一:明确落地的超级产业趋势**,如AI编程、个人智能助理(Cloudbot)、多模态方向(AI短剧/漫剧)[1][9] 在AI编程领域,卓翼信息和智谱科技是核心公司,智谱科技GIM 4.7版本后Coding计划用户高速增长导致算力紧张[9][10] Cloudbot受益公司包括大模型公司(Minimax、腾讯、阿里巴巴)、云计算公司(深信服、优刻得、青云科技)及网络服务商(网宿科技)[3][11] 多模态方向核心公司包括兆驰股份、万兴科技[12] * **主线二:大型科技公司链条上的长期合作机会**,如算力IDC租赁或有实际价值创造潜力的AI应用公司[9] 看好阿里巴巴和腾讯在2026年于AI方向取得突破[13] * **网宿科技在AI时代的重要性与前景**:在AI时代重要性凸显,因其提供低延迟、高交互次数及海量数据处理能力,满足AI应用对快速反馈的要求[14] Agent数量及交互次数的大幅增加(一次需求可能调动多个工具),以及AI浏览信息量远超人类,使得数据流量显著增多,网宿科技作为CDN服务商市场需求与Agent使用量成正比[14] 预计未来一两年将出现“量价齐升”局面:假设其保持10%市场份额且CDN价格维持每GB 0.2元,Agent海量需求将打开巨大收入利润空间;当前CDN价格已上涨10%-20%,且涨价趋势预计持续[15][16] 网宿科技被视作AI Agent爆发元年的“金铲子”角色[14][16] 其他重要内容 * **智谱科技的估值风险提示**:尽管在AI编程领域需求旺盛,但智谱科技当前估值可能偏高,投资者需关注潜在风险[10] * **投资者策略参考**:需密切关注相关公司经营状况改善的数据,作为估值和EPS修复的驱动因素[1] 关注字节跳动能否借春晚扩大优势,以及阿里巴巴能否通过生态整合实现弯道超车[8]
马斯克悄悄让Grok 5在韩服打LOL?醉翁之意在世界AI模型
36氪· 2026-02-02 08:22
文章核心观点 - 一个在《英雄联盟》韩服服务器上出现的名为“택배기사한 진”的神秘账号,因其在51小时内完成56场对局并取得52胜4负、胜率一度高达95%的惊人战绩,以及连续长时间高强度对局、全能英雄池和精准操作等非人类特征,被广泛猜测为人工智能(AI)在操控[1][3] - 证据和舆论将这一神秘账号与埃隆·马斯克旗下xAI公司此前宣布的Grok 5项目联系起来,该项目计划在2026年挑战顶级职业战队T1,此次事件被视为Grok 5在复杂游戏环境中进行“类人”多模态能力训练和展示的预演[4][6][11] - 此次事件的核心意义超越了电竞游戏本身,其真正目的在于展示Grok 5在通过视觉(摄像头)理解复杂动态场景方面的强大能力,这被视为推动特斯拉Optimus机器人和FSD(完全自动驾驶)实现“端到端视觉智能”的关键一步[11] AI技术展示与限制 - 该账号的操作展现出典型的AI特征,包括决策冷静、做出不合常理的决策、精通所有位置与英雄,以及对线期以精准走位躲避技能且几乎没有多余动作,体现了AI追求效率最大化的特性[3][4] - 与早期游戏AI(如OpenAI Five和AlphaStar)直接从游戏内存读取数据不同,此次疑似Grok 5的测试被限制在“人类条件”下,仅通过摄像头读取屏幕信息,这极大地增加了任务难度[6] - 在视觉模式下,AI需要从整个屏幕画面中(可能只有10-20%是有效信息区)实时处理繁杂特效,精确定位英雄位置和状态,并进行动态决策和语义分割,同时纠正摄像头畸变带来的误差,这对模型的推理效率和实时决策能力提出了极高要求[7][8] 对电竞与游戏行业的潜在影响 - AI大模型为电竞行业带来了新的机会,例如可用于赛后分析、选手训练,通过模拟特定战队的比赛录像生成其行动逻辑,充当高水平的训练对手,帮助战队提前熟悉对手思路并制定针对性战略[12] - AI在游戏开发与运营中具有广泛应用前景,例如在测试端模拟不同水平的真实玩家进行海量对局,以更精准地平衡新英雄强度;或利用AI生成更智能的NPC,甚至调控玩家游戏体验(如为连败玩家匹配AI队友)[16][17] - AI技术进入游戏领域也引发了对外挂泛滥的担忧,尽管完整版大模型难以在个人电脑运行,但其决策逻辑可能通过知识蒸馏等技术迁移到参数更小的开源模型(如Qwen)上,从而制造出拥有顶级职业选手意识和操作的、难以被反作弊系统识别的“AI玩家”[14][16] AI发展的战略意义 - Grok 5在《英雄联盟》中的挑战行为,本质上是为证明其已拥有接近甚至超越人类的图像识别与复杂场景理解能力,这是实现通用人工智能和理解现实世界的关键一步[11] - 该技术突破若能实现,将直接赋能特斯拉的Optimus机器人和汽车FSD系统,推动其向真正的“端到端视觉智能”迈进,具有重大的商业和战略价值[11] - 此次事件被视为游戏行业的又一个“AlphaGo时刻”,预示着AI将从游戏开发、测试、运营到玩家体验等全环节,给整个行业带来巨大而深远的变革[17]
中美AI行业的关键时刻
虎嗅APP· 2026-01-29 22:10
文章核心观点 - 2025年是中美AI竞争格局发生深刻变化的一年,中国AI力量(如DeepSeek、Manus、Qwen、K2)在工程能力、开源和商业化方面赢得全球认可,开始与美国并行竞争 [7][8][72] - 地缘政治(如美国反向投资审查OIR)深刻影响资本与人才的流动,迫使华人AI创业者在“中国公司”与“美国公司”之间做出明确选择,全球化创业模式发生根本性转变 [12][18][22] - 中国一级市场在2025年迎来AI早期项目的短暂春天,资本狂热涌向具身智能、AI应用与Agent、多模态、AI硬件四大方向,其中硬件投资尤为火爆 [32][40][44] - 硅谷巨头(OpenAI、谷歌、Meta、英伟达)的竞争进入生态团战新阶段,模型能力差异缩小,竞争焦点从单纯的技术领先转向资本、基建和生态的整合 [57][64][65] - 技术演进面临Scaling Law的天花板争议,行业探索从预训练数据堆砌转向推理侧扩展、智能体协作及物理世界融合,同时高昂的算力成本仍是商业化的核心挑战 [75][76][80] 一、不平凡的春节 - 2025年春节期间,DeepSeek R1和宇树机器人展示了中国团队卓越的工程能力,以更少算力、更高效率做出了媲美GPT-4o的模型,震撼硅谷 [10][11] - DeepSeek的成功在美国引发政策分歧:一派认为算力卡脖子无效,另一派(以Anthropic CEO Dario为代表)主张对华加强管制 [11] - 随着美国政治变化,针对中国AI的算力限制、投资限制和AI扩散规则升级,将中美科技竞争推向新高潮 [12] 二、Manus的7500万美元融资 - 2025年第一季度,DeepSeek、宇树和Manus让硅谷热议中国,市场情绪高涨 [14] - 硅谷顶级风投Benchmark创始人来华,以7500万美元投资Manus母公司蝴蝶效应,将其估值推高至5亿美元,此举被视为针对中国背景AI项目的“超级支票”,极具象征意义 [15][16] - DeepSeek和Qwen等中国开源模型将AI推入普惠的推理时代,降低了使用成本,而Manus则展示了产品定义和工程创新的力量,共同宣告AI应用时代到来,重新激活了美元VC的投资热情 [15][16] 三、Reverse CFIUS下,华人的AI创业 - 美国“反向投资审查”(OIR)规则限制美国资本投资中国AI公司,且“中国公司”的界定范围被扩大,导致如Benchmark投资Manus的交易面临美国财政部的审查风险 [18] - 规则造成寒蝉效应,顶级美元机构(如红杉、GGV)已通过设立独立分支应对,而纯美元机构则形成新默契:追求“资本与人才的脱钩”,即投资华人团队的前提是项目必须在法律、数据和市场上彻底剥离“中国属性” [19] - Manus在收到问询函后,裁撤武汉团队并将总部迁至新加坡,被视为一种示范,但律师指出这并非成为“美国公司”的标准答案,美国的核心关切是企业最终是否会完全站在美国一边 [20][21] - 地缘政治张力下,立场必须明确,上一代利用中美成本洼地的全球化创业模式终结,若想获得本土美元大额投资,必须彻底成为一家美国公司 [22] 四、3亿美金前很热闹,3亿美金后融不到 - 中国AI创业公司估值达到3亿美元后,面临国内融资天花板,因为市场缺乏PE资金,只有VC和投机资金,促使许多创始人考虑前往硅谷融资 [23][24] - 融入硅谷面临语言表达、文化差异和思维模式挑战,需要数年时间适应,而非简单认为硅谷“人傻钱多” [25][27] - Hygen(诗云科技)是成功范本:作为华人团队,在实现产品市场匹配(PMF)和强劲现金流(ARR逼近1亿美元)后,通过资本隔离(回购早期股份)、物理隔离(总部迁至洛杉矶)和吸引顶级美元机构(Benchmark合伙人入董事会),跑通了“华人团队+中国技术红利+硅谷资本+全球市场”的路径 [26][27] - 新一代华人创业者更具野心和全球视野,DeepSeek等中国项目的成功也助力打破了硅谷的“竹子天花板” [27][28] 五、中国一级市场的短暂春天 - 2025年初,受美股AI龙头估值飙升的溢出效应影响,中国AI一级市场情绪高涨,资本主要流向具身智能、AI应用与Agent、多模态、AI硬件四个方向 [32] - **具身智能**:因宇树机器人春晚表演爆火,成为年度关键词,头部公司账上现金不少于10亿元人民币,大量吸收国资人民币基金,因其符合长周期、硬科技的国家战略导向 [33] - **AI应用与Agent**:基础模型格局收敛及开源普惠推动应用时代成熟,头部美元基金(如红杉、高瓴)上半年投资活跃,中东主权基金也加大投资,案例显示liblib日收入达15万美元,下一轮融资额预计达8亿美元 [36] - **多模态**:中国市场急需视觉AI底座模型,快手因推出可灵模型市值重估,创业公司Vivix.AI因创始人稀缺的大规模模型训练经验,估值在一年内从1-2亿美元飙升至13.4亿美元 [37][38] - **AI硬件**:2025年是AI硬件投资爆发元年,技术成熟、政策推动(“人工智能+行动”)、中国供应链红利共同催生热潮,5月份流向硬件的资金占AI领域总投融资额50%以上,截至8月,具身智能与AI硬件领域投融资总额突破386亿元 [40][44] - 投资机构策略分化:高瓴等机构“口袋深”,广泛孵化大厂精英创业;云启等机构则发起专项计划投资“98后”年轻创业者,认为年轻人将带来无穷可能 [45][46][47] 六、顶尖项目的融资窗口,只在几个月内 - AI时代形成共识的窗口期极短,顶尖项目的融资机会往往只在几个月内,类似十年前的自动驾驶行业 [50][53] - 创业对融资的依赖度降低,优质标的稀少导致资本集中化,市场上绝大部分资金被少数项目拿走 [52] - 投资风格分化为两种:一是在热门赛道“矮子里面拔将军”以求参与;二是坚持寻找能定义未来的颠覆性项目,批评许多项目只是用AI技术重做传统应用 [53] - 年轻一代投资人更为积极,在浪潮中渴望投出代表作以丰富个人履历 [53] 七、硅谷风云:属于巨头的棋局 - 2025年基础模型竞争如季度排位赛,格局变化极快,令二级市场难以定价 [57] - **王者对决**:OpenAI与谷歌是主要竞争者。OpenAI保持先发优势但GPT-5显示Transformer架构 Scaling Law 天花板初现;谷歌凭借Gemini系列(尤其是2.5 Pro和Nano Banana)实现翻身,在多模态和记忆方面表现稳定优异 [58] - **生态博弈**:OpenAI与主要投资者微软关系出现嫌隙,Sam Altman转而联合英伟达启动“星际之门”项目,被视为去微软化举措 [61] - **英伟达的合纵连横**:承诺向OpenAI分批投资1000亿美元(前提是部署英伟达系统),并收购AI推理芯片公司Groq的LPU资产以巩固生态,其与OpenAI、甲骨文形成的“星际之门”闭环导致甲骨文自由现金流转负,股价大幅波动 [62][63][64] - **其他巨头的挣扎**:Meta在基础模型上全面掉队,内部组织分散,为追赶不惜重金挖人;马斯克的X.AI通过错位竞争争取门票 [67][68][66] - **Meta收购Manus的意图**:可能意味着其竞争重心从自研模型转向打造最强智能体执行层,以资本兑换技术时间和市场势能 [70] 八、中国的开源之路 - 2025年,中国AI体系在国际报告中首次从“外围追赶者”被提升为“平行竞争者”,被认为在开源AI和商业化部署方面设定节奏 [72] - 尽管在绝对SOTA水平上因算力基础设施受限而落后,但中国开源模型(DeepSeek、Kimi、Qwen)在多项关键性能上实现对Meta Llama系列的反超,“开源看中国”成为全球共识 [72] - 中国模型凭借更高性价比成为全球选择,例如智谱的coding能力全球靠前,定价仅为Anthropic的1/7,借此获得多国主权大模型订单;下半年硅谷创业公司也开始切换使用Qwen、Deepseek和K2 [73] 九、技术的演进:从2023~2025,以及2026的预判 - 技术演进路径从2022年底的预训练爆发、2024年底的强化学习爆发,到2025年中外模型在预训练和后训练上各有侧重 [75] - 围绕Scaling Law是否到达天花板出现两派思潮:“撞墙派”(如LeCun、Ilya)认为堆算力和数据的边际效应递减;“不死派”(如Hinton、Dario)认为Scaling Law依然有效,正转向推理侧扩展(Inference-time Scaling) [76] - Scaling Law正经历从“模型尺寸大小”扩展,过渡到“模型思考深度”扩展,未来将走向“智能体协作网络效应”扩展 [76] - AI正从数字世界迈向物理世界,商业公司致力于在现实与数字世界间架设桥梁,通过传感器获取数据、构建数字孪生,并探索如“世界模型”等前沿方向 [77][83] 十、回归商业的现实 - 大模型行业仍处早期,巨额算力成本带来巨大盈利压力:OpenAI 2025年年化收入200亿美元,但算力租卡成本高达160亿美元,经营亏损119.2亿美元,相当于每赚1美元净亏损0.6美元 [80] - 推理成本随着推理侧扩展而暴涨,将成为全行业趋势,但新时代AI的商业模式仍在探索中 [80] - 中国算力供给面临瓶颈,进口受限,焦点从“卡的数量”转向“算力可得性”,蚂蚁、米哈游等大企业开始自建算力,但有能力者屈指可数 [84] - 底层算力和基建的自控权是竞争决定性因素,美国正通过债券等形式将算力资产化 [82] - 对于创业公司,追求“模应一体”和产品化是现实选择,模型编排(协调多个模型工作)可能成为其优势所在,而用户增长与留存是检验产品的金线 [85]
月之暗面创始人杨植麟为Kimi锁定系统智能主赛道
每日经济新闻· 2026-01-29 21:03
公司核心产品发布 - 月之暗面于1月27日正式发布并开源全新多模态模型Kimi K2.5,该模型被定义为公司目前最强大的模型 [1] - Kimi K2.5是一个拥有1万亿参数的MoE基础模型,是公司迄今最智能且最全能的模型,在Agent、代码、图像、视频及通用智能任务上取得开源最先进表现 [1] - 模型采用原生多模态架构,同时支持视觉与文本输入、思考与非思考模式、对话与Agent任务 [1] 产品核心能力升级 - 模型视觉理解能力得到提升,并与推理、代码、Agent等能力结合,降低了用户交互门槛,新增了对视频内容的直接识别与理解能力 [3] - 模型将其智能体能力系统性扩展至日常办公领域,开始掌握Word、Excel、PPT、PDF等常用软件的中高阶技能 [4] - 模型最大亮点在于从单个Agent进化到Agent集群,能够创建并协调一大群专项Agent并行工作以提升效率,此功能目前仅面向月费199元的Allegretto会员开放 [5][10] 产品性能表现 - 在Agent评测中,Kimi K2.5在HLE上拿到50.2%的成绩,在BrowseComp上拿到74.9%的成绩,相比前代模型K2 Thinking的44.9%和60.2%有显著提升 [6] - 在编程以及视觉能力上,Kimi K2.5取得了与Claude Opus4.5、GPT 5.2 XHigh、Gemini 3.0Pro等闭源模型基本相当的成绩 [6] - 在多项评测中,Kimi K2.5的运行成本大幅低于GPT 5.2 XHigh,并且在HLE、BrowseComp两项测试中成绩高于GPT 5.2 XHigh [6] 公司商业化进展 - 公司基于Kimi K2.5模型的视频动作识别与评估等功能,与运动科技公司Keep合作,其AI教练Kaka即将上线 [6] - 公司延续自2025年确立的生态策略,通过与财新传媒、小红书、网易游戏等各领域伙伴深度绑定,将智能体能力注入具体场景 [7] - 2025年9月至11月,公司海内外付费用户数平均月环比增长超过170%,同期海外API收入增长达4倍 [10] - 公司已推出分层会员付费制度,将编码工具与Agent任务额度整合为三档订阅服务,月费分别为49元、99元与199元 [10] 公司财务状况与战略 - 公司近期完成了5亿美元C轮融资且大幅超募,当前现金持有量超过100亿元,并明确表示短期不着急上市 [8] - 公司首要目标是通过技术改进与模型规模化,让下一代K3模型的等效算力提升至少一个数量级,在预训练水平上追平世界前沿 [11] - 公司最终聚焦于智能体本身的产品化与商业化,以创造顶尖生产力价值为导向,实现营收规模的量级增长 [11] 行业竞争动态 - Kimi K2.5的推出恰逢行业密集上新窗口期,同日DeepSeek团队开源了DeepSeek-OCR 2模型,前一日阿里发布了千问旗舰推理模型Qwen3Max-Thinking [2] - 中国AI企业正试图跳出单纯的算力比拼,走向更差异化的深度思考发展路径,Agent和视觉理解能力成为本轮技术迭代的竞赛焦点 [2] - 字节跳动、阿里巴巴等互联网大厂早已洞察视觉理解的关键价值,并通过合作在美术馆、博物馆等领域锤炼该能力 [8] - 2026年初,随着智谱新一代旗舰模型与稀宇科技旗下MiniMax相继上市,中国大模型行业正式步入资本市场驱动的新阶段 [8]
国产大模型密集发布
第一财经· 2026-01-28 18:08
文章核心观点 - 2026年春节前,国产大模型厂商密集发布更新,行业竞争白热化,标志着行业从参数竞赛和实验室Demo阶段,迈向工程化成熟期,聚焦效率、成本与规模化落地[5] - 行业技术演进聚焦于两大方向:原生多模态能力的深化与推理工程化的提效,旨在让AI更易用、实用和好用[7][11] - 对于企业用户而言,模型的性价比远比在基准测试中争夺“第一”更重要,成本持续下降是AI实现B端规模化落地的关键,国内主流商用模型API已进入“厘时代”[13][14][15] - 行业竞争格局呈现马太效应,通用大模型领域强者恒强,中小厂商机会在于细分行业,模型厂商的技术指标逐渐聚焦于成本把控、推理与工程化能力[16][19] 行业竞争态势与阶段特征 - 2026年春节前夕成为国产大模型集中展示的关键节点,多家厂商更新模型并引发海外社交平台热议,下周预计仍有新品发布[5] - 头部公司积极卡位竞争,良性竞争有助于缩短国产模型与国外模型的差距[14] - 行业进入新的“工程化成熟期”,从拼规模转向拼效率与落地能力,从参数竞赛转向工程优化,产品交付从实验室Demo走向规模化服务[5][15] - 开源正在加速技术迭代并大幅降低成本,使大模型从少数巨头能力走向产业基础设施[15] 技术发展趋势:多模态与推理 - 多模态成为重要趋势,厂商积极进行技术探索,例如Kimi K2.5定义为原生多模态架构,DeepSeek-OCR 2采用创新编码方法模拟人类视觉逻辑[8][9] - 推理工程化提效是主流趋势,技术创新核心在于提升推理性能、降低推理成本和模型训练门槛[11] - 模型厂商技术指标逐渐聚焦,考验方向包括成本把控能力、推理能力、工程化能力[19] - 具体技术优化维度包括提升token效率、实现长上下文支持,以降低损耗并完成复杂Agent任务[20] 企业应用与成本考量 - 企业用户选择模型时,性价比是关键决策因素,模型优势迭代快速,企业会按月或季度进行评测并选择对应最好的模型[14] - 大模型调用成本持续显著下降,从2025年初到年末,有企业客户token调用量实现多倍增长,但调用费用却大大降低,国内主流商用模型API进入“厘时代”[14][15] - 企业应用呈现多样化选型,例如在保险业务中,豆包适合高情商对话场景,DeepSeek V3.2性价比突出,智谱在编程领域受认可,千问是精调的优秀基座[15] - 企业在推动AI应用过程中,仍面临模型幻觉、可解释性差、推理能力薄弱等挑战[16] 未来需求与行业机会 - 未来应用厂商希望大模型在推理能力的动态优化方面实现突破,使模型能自主判断是否需要深度思考,避免不必要的算力消耗[16] - 多模态技术的落地优化是重要需求,当前生成内容像“抽盲盒”,难以满足专业场景对稳定性和可控性的要求[17] - 通用大模型行业马太效应凸显,强者恒强,中小玩家的机会更多出现在制造、金融、教育、医疗等细分行业领域[16] - 客户需求推动行业上下游加速联动,要求软硬双端从算法与架构层面降低整体成本,短期依赖工程优化,长期看新型硬件和芯片创新[21][22] - AI发展进入“干中学”阶段,行业结束模型盲目竞争,进入以推理能力为主导的时代[23]