Workflow
多模态模型
icon
搜索文档
粤开市场日报-20260209-20260209
粤开证券· 2026-02-09 15:49
核心观点 - 报告为一份市场日报,核心观点是2026年2月9日A股市场呈现普涨格局,主要指数悉数上涨,成交额显著放量,科技成长板块表现尤为强势 [1] 市场回顾:指数表现 - 截至收盘,上证指数涨1.41%,收报4123.09点 [1] - 深证成指涨2.17%,报14208.44点 [1] - 科创50指数涨2.51%,收报1458.16点 [1] - 创业板指涨2.98%,收报3332.77点 [1] - 全市场个股涨多跌少,4609只个股上涨,756只个股下跌,108只个股收平 [1] - 沪深两市今日成交额合计22495亿元,较上个交易日放量1038亿元 [1] 市场回顾:行业板块表现 - 申万一级行业全部收涨 [1] - 通信行业涨幅居首,达5.17% [1] - 综合行业涨幅为4.70% [1] - 传媒行业涨幅为3.50% [1] - 电子行业涨幅为2.97% [1] - 计算机行业涨幅为2.88% [1] - 石油石化、银行、食品饮料行业涨幅靠后,分别为0.21%、0.36%、0.37% [1] 市场回顾:概念板块表现 - 涨幅居前的概念板块包括:光模块(CPO)、钙钛矿电池、光通信、短剧游戏、培育钻石、光芯片、Kimi、虚拟人、BC电池、稀土、光伏玻璃、中文语料库、多模态模型、AIGC、WEB3.0 [2] - 回调的概念板块包括:水电、白色家电精选、油气开采 [11]
A股超4600股上涨,AI应用批量涨停,港股智谱狂飙近40%
21世纪经济报道· 2026-02-09 15:43
市场整体表现 - 2025年2月某交易日,A股三大指数高开高走,沪指上涨1.41%至4123.09点,深成指上涨2.17%至14208.44点,创业板指上涨2.98%至3332.77点 [1][2] - 市场成交活跃,沪深两市成交额达2.25万亿人民币,较上一个交易日放量1038亿人民币 [1] - 市场呈现普涨格局,万得全A指数覆盖的股票中,有4609只上涨,仅756只下跌 [2] 主要指数及板块行情 - 主要宽基指数全线上涨,科创综指涨幅最大,达2.47%,中证红利指数涨幅相对较小,为0.67% [2] - AI及多模态模型相关板块表现强势,中文在线、捷成股份等多只个股涨停或涨幅超过10% [3] - 光伏概念股表现活跃,协鑫集成实现4连板,TCL中环4天内收获2个涨停板 [4] - 半导体板块上涨,炬光科技涨超17%,芯原股份涨近15% [5] - 贵金属板块受现货价格大涨刺激而拉升,湖南白银涨停,现货白银日内涨幅达4.97%,最高触及82美元/盎司 [5] - 通信服务板块午后拉升,光环新网涨超10% [5] - 商业航天概念股走高,中超控股、顶固集创等多股涨停 [4] - 油气股走势相对较弱 [5] 行业与公司动态 - AI视频生成领域进展显著,国内厂商可灵AI于2月5日正式上线覆盖影视级全流程的3.0系列模型,字节跳动的多模态模型Seedance2.0也于2月7日完成重要更新,在多镜头连续生成中实现主体特征高度稳定 [4] - 开源证券研报认为,多模态模型能力的提升将释放其商业化潜力,并预计2026年该领域将迎来类似“DeepSeek时刻”的突破,推动影视、游戏、广告等内容创意行业繁荣 [4] - 杉杉股份因控股股东重整事项开盘涨停,实现两连板,根据公告,若重整成功,公司控股股东将变更为皖维集团,实际控制人将变更为安徽省国资委 [5] - 港股市场同步走强,恒生指数与恒生科技指数午后均涨超1%,AI大模型公司智谱股价一度涨超40%,创上市以来新高,市值逼近1300亿港元 [6] - 泡泡玛特港股股价涨近6%,报257港元,创2025年10月以来新高,公司在年会上披露,2025年全球注册会员超1亿人,其标志性IP产品LABUBU全年销量超1亿只 [8]
行业周报:周观点:2026年,多模态模型有望迎来DS时刻
开源证券· 2026-02-08 18:45
报告行业投资评级 - 行业投资评级:看好(维持)[1] 报告核心观点 - 核心观点:2026年多模态模型有望迎来其“DS时刻”,在能力大幅提升的同时实现成本端显著下降,从而推动影视、游戏、广告等内容创意领域的繁荣 [5][12] - 核心观点:多模态模型领域的竞争加剧,可灵3.0系列与字节Seedance 2.0相继正式上线,标志着AI正式进入影视与创意内容的核心生产环节 [6][13] - 核心观点:商业化将成为多模态模型厂商2026年的重要命题,模型能力增强与成本下降是推动商业化落地的关键 [7][14] 根据相关目录分别总结 一周市场回顾 - 市场表现:本周(2026.2.2-2026.2.6),沪深300指数下跌1.33%,计算机指数下跌3.27% [4][16] 周观点:多模态模型发展 - 发展历程:OpenAI于2024年2月推出初代Sora模型(视频领域的GPT-1时刻),2025年9月底推出Sora 2(视频领域的GPT-3.5式突破),2025年10月谷歌发布升级的Veo 3.1系列,2026年初可灵3.0系列与字节Seedance 2.0相继上线 [5][12] - 技术进展(可灵3.0):基于All-in-One理念构建一体化视频模型体系,覆盖图片生成、视频生成、编辑及后期等影视级全流程链路 [6][13] - 技术进展(Seedance 2.0):能生成真正的1080p分辨率广播级视频,具备音视频同步、多镜头叙事、流畅运动合成及卓越的提示词遵循能力 [6][13] - 商业化进展:以可灵AI为例,截至2025年12月,已拥有超6000万创作者,生成视频超6亿个,服务企业用户超3万,年化收入运行率达2.4亿美元 [7][14] 公司动态 - **焦点科技**:发布2025年度业绩快报,预计实现营业总收入192,013.25万元,同比增长15.06%;预计实现归母净利润50,412.98万元,同比增长11.73% [17] - **通行宝**:2025年度预计实现营业收入106,777.79万元,同比增长19.24%;预计实现归母净利润22,125.68万元,同比增长5.51% [17] - **恒为科技**:2025年度预计实现营业收入104,668.74万元,同比减少6.31%;预计实现归母净利润3,493.80万元,同比增长30.13% [18] - **三未信安**:拟使用自有资金人民币1000万元在海南自贸区设立全资子公司 [19];发布2026年股票期权激励计划(草案),拟授予230.00万份股票期权,约占公司股本总额2.00%,行权考核目标以2025年营收为基数设定触发值与目标值 [20] - **东软集团**:发布2026年员工持股计划草案,拟持有标的股票数量约3065万股,约占公司总股本2.57%,资金总额不超过32,000万元,参与人数预计不超过1100人 [21] - **亚信安全**:员工持股计划股票来源为公司回购股份,规模合计不超过1349.0585万股,占公司总股本3.37%,首次授予人数不超过213人 [21] - **股东减持**:智迪科技、大豪科技、恒银科技、光庭信息、拓尔思等公司公告了股东或高管拟减持股份的计划 [22][23][24] 行业动态 - **国内要闻**: - 算力基建:2月5日,中科曙光在国家超算互联网郑州核心节点同时部署上线3套scaleX万卡超集群,依托超3万张国产AI卡,覆盖AI大模型训练等多种算力场景 [25] - 模型发布:可灵AI于2月5日正式全球上线3.0系列模型 [26] - **海外要闻**: - 模型发布:OpenAI于2月6日推出最强AI智能体编程模型GPT-5.3-Codex,支持任务执行中的交互引导,正演变为通用计算机协作者 [27][28] - 公司财报:Snap发布2025年Q4及全年财报,Q4营收达17.16亿美元,同比增长10%;全年营收59.31亿美元,同比增长11%;Snapchat全球月活用户达9.46亿,同比增长6% [29] - 融资动态:无人驾驶公司Waymo获160亿美元注资,估值达1260亿美元 [30];AI公司Anthropic将最新一轮融资目标从100亿美元提高至200亿美元,估值有望达3500亿美元 [31] - 产品发布:马斯克旗下xAI发布Grok Imagine 1.0,可生成10秒、720p分辨率视频,过去30天内生成12.45亿个视频 [31] - 航天计划:SpaceX首席执行官埃隆·马斯克宣布,星舰V3版本将于约6周后进行首次飞行测试,旨在将新一代星链卫星(V3)送入轨道 [32] 投资建议 - 多模态模型受益标的:包括万兴科技、海天瑞声、虹软科技、当虹科技、快手-W、美图公司等 [8][15] - AI应用端投资机会:推荐金山办公、合合信息、鼎捷数智、迈富时、致远互联、金蝶国际、博彦科技、用友网络、同花顺、恒生电子、拓尔思、科大讯飞、焦点科技、中科创达、税友股份、上海钢联等 [8][15] - 其他受益标的:包括泛微网络、福昕软件、汉得信息、第四范式、多点数智、北森控股、新开普、新致软件、欧玛软件、汉邦高科、石基信息、汉王科技、汉仪股份、三六零、彩讯股份、金桥信息、佳讯飞鸿等 [8][15]
行业周报:周观点:2026年,多模态模型有望迎来DS时刻-20260208
开源证券· 2026-02-08 18:13
报告行业投资评级 - 看好(维持)[1] 报告核心观点 - 2026年多模态模型有望迎来“DS时刻”,在能力提升的同时实现成本端大幅下降,从而推动影视、游戏、广告等内容创意领域的繁荣 [5][12] - 商业化将成为多模态模型厂商的重要命题,2026年将是其降本提质、实现商业化落地的关键一年 [7][14] 周观点:多模态模型进展 - **技术迭代加速**:OpenAI于2024年2月推出初代Sora模型(视频领域的GPT-1时刻),2025年9月底推出Sora 2(视频领域的GPT 3.5式突破)[5][12];2025年10月16日,谷歌发布重大升级的Veo 3.1和Veo 3.1 Fast付费预览版 [5][12] - **国内模型密集发布**:2026年初,可灵AI正式全球上线3.0系列模型(可灵视频3.0、可灵视频3.0 Omni、可灵图片3.0、可灵图片3.0 Omni),覆盖影视级全流程链路 [6][13];2月7日,字节Seedance 2.0正式上线,支持生成真正的1080p广播级视频、音视频同步及多镜头叙事 [6][13] - **商业化潜力显现**:可灵AI是国内商业化最快的多模态模型之一,截至2025年12月,已拥有超6000万创作者,生成视频超6亿个,服务企业用户超3万,年化收入运行率达2.4亿美元 [7][14] 市场回顾与投资建议 - **市场表现**:本周(2026.2.2-2026.2.6),沪深300指数下跌1.33%,计算机指数下跌3.27% [4][16] - **受益标的**:多模态模型发展受益标的包括万兴科技、海天瑞声、虹软科技、当虹科技、快手-W、美图公司等 [8][15] - **AI应用端机会**:报告建议继续关注AI应用端投资机会,推荐金山办公、合合信息、鼎捷数智、迈富时、致远互联、金蝶国际、博彦科技、用友网络、同花顺、恒生电子、拓尔思、科大讯飞、焦点科技、中科创达、税友股份、上海钢联等 [8][15] 公司动态 - **焦点科技业绩快报**:2025年度预计实现营业总收入192,013.25万元,同比增长15.06%;预计实现归母净利润50,412.98万元,同比增长11.73% [17] - **通行宝业绩快报**:2025年度预计实现营业收入106,777.79万元,同比增长19.24%;预计实现归母净利润22,125.68万元,同比增长5.51% [17] - **恒为科技业绩快报**:2025年度预计实现营业收入104,668.74万元,同比减少6.31%;预计实现归母净利润3,493.80万元,同比增长30.13% [18] - **三未信安投资与激励**:拟使用自有资金1000万元在海南自贸区设立全资子公司 [19];发布2026年股票期权激励计划(草案),拟授予230.00万份股票期权,约占公司股本总额2.00%,行权考核目标以2025年营收为基数,2026-2030年触发值增速不低于10%、20%、30%、40%、50% [20] - **东软集团员工持股计划**:发布2026年员工持股计划草案,拟持有标的股票约3065万股,约占公司股本总额2.57%,资金总额不超过32,000万元,参加人数预计不超过1100人 [21] - **亚信安全员工持股计划**:首次授予员工总人数不超过213人,股票来源为回购股份,规模不超过1349.0585万股,占公司当前股本总额3.37% [21] - **股东减持公告**:涉及智迪科技、大豪科技、恒银科技、光庭信息、拓尔思等公司,减持比例最高不超过公司总股本的1.00% [22][23][24] 行业动态 - **国内算力基建**:2月5日,中科曙光在国家超算互联网郑州核心节点同时部署上线3套scaleX万卡超集群,依托超3万张国产AI卡,覆盖AI大模型训练、高通量推理等场景 [25] - **海外AI进展**:2月6日,OpenAI推出最强AI智能体编程模型GPT-5.3-Codex,支持任务执行中交互且不丢失上下文 [27][28];马斯克旗下xAI发布Grok Imagine 1.0,可生成10秒、720p分辨率视频,过去30天内生成了12.45亿个视频 [31] - **企业融资与估值**:无人驾驶出租车公司Waymo获160亿美元注资,估值达1260亿美元 [30];AI公司Anthropic将最新一轮融资目标从100亿美元提高至200亿美元,估值有望达到3500亿美元 [31] - **科技公司财报与计划**:Snap第四季度营收达17.16亿美元,同比增长10%;全年营收59.31亿美元,同比增长11%;Snapchat全球月活用户达9.46亿,同比增长6%;新一代Specs智能眼镜计划于2026年发布 [29] - **太空科技**:SpaceX首席执行官埃隆·马斯克宣布,星舰V3版本将于六周后进行首次飞行测试,目标是将新一代星链卫星(V3)送入轨道,单次可送100颗卫星上天 [32]
Attention真的可靠吗?上海大学联合南开大学揭示多模态模型中一个被忽视的重要偏置问题
机器之心· 2026-02-04 09:04
研究核心观点 - 视觉-语言模型(VLMs)中广泛用于指导视觉token剪枝的注意力机制存在系统性偏置,并非可靠的语义重要性指标,这影响了模型高效部署的可靠性[2][5] - 上海大学与南开大学的研究团队提出了一种无需重新训练的注意力去偏方法,通过修正位置偏置和抑制padding token影响,能作为即插即用模块提升多种主流剪枝方法的性能与稳定性[6][17] - 实验表明,该方法在图像与视频理解的多项基准测试中,对LLaVA-7B/13B等主流模型及六种剪枝策略均带来了一致且稳定的性能提升,尤其在激进剪枝场景下效果显著[21][25] 研究意义 - 视觉-语言模型在图像理解、视觉问答等任务中表现出色,但面临推理成本高、速度慢的现实部署挑战[5] - 为提升效率,行业普遍采用视觉token剪枝技术,并依赖注意力机制作为判断视觉信息重要性的核心依据[5] - 研究发现,注意力机制受到与真实语义无关的结构性偏置影响,若直接用于剪枝会误导结果,影响模型性能[5] 研究背景 - 直觉上,注意力机制被理解为“模型更关注哪里”,常被视为语义重要性的体现[10] - 研究揭示了VLMs中注意力存在的两类典型系统性偏置:1) 位置偏置(近因偏置),即模型更倾向于关注序列中靠后(如图像下方)的token;2) 由padding引发的“注意力沉没”现象,即语义空白的填充区域因隐藏状态异常激活而获得高注意力[11][14] - 当这些有偏的注意力被用于剪枝排序时,偏置不仅不会被削弱,反而会被放大,导致剪枝结果偏离真实语义需求[16] 研究方法 - 研究团队未提出新剪枝算法或修改模型结构,而是从修正注意力本身出发[17] - 方法核心是观察到注意力偏置呈现稳定的整体趋势,通过拟合注意力随token位置变化的趋势曲线来构建并修正“位置偏置”[17] - 在剪枝阶段显式抑制padding token的影响,避免空白区域干扰排序[17] - 整个去偏过程无需重新训练模型,也不依赖特定剪枝策略,可作为即插即用模块集成到现有方法中[17] 实验结果 - 方法被集成到FastV、PyramidDrop、SparseVLM、HiMAP、TokenCarve、iLLaVA等6种主流基于注意力的剪枝方法中,并在10个图像理解基准和3个视频理解基准上进行了系统评估[21] - 在LLaVA-7B模型上,应用去偏方法后,各剪枝策略在多项指标上获得提升。例如,FastV方法在VQAv2基准上的得分从73.2提升至76.6,在MME基准上从1442.3提升至1499.5;PyramidDrop在POPE基准上从80.8提升至84.3[22] - 在LLaVA-13B模型上同样观察到一致提升,例如TokenCarve方法在VQAv2基准上从77.6提升至78.6,在MME基准上从1500.5提升至1523.7[22] - 在视频理解基准(如MSRVTT、MSVD、TGIF)上,去偏方法也为各剪枝策略带来了准确性(Acc)和得分(Score)的普遍提升[25] - 可视化分析证实,去偏后模型保留的视觉区域更集中于目标物体及关键细节,减少了无关背景和padding区域的干扰,提升了剪枝的合理性与可解释性[25]
京产大模型成果登上国际顶级期刊
新浪财经· 2026-01-30 04:54
2018年以来,GPT采用"预测下一个词元(Next-token prediction,NTP)"的自回归路线,实现了语言大 模型重大突破,开启了生成式人工智能浪潮。而擅长同时处理文字、图片、视频等多种形态信息的多模 态模型主要依赖对比学习、扩散模型等专门路线。在此背景下,一个重要问题困扰行业数年:能否用一 种简单、统一的方法即自回归路线,让AI(人工智能)同时学会高效地处理文字、图片和视频? 智源这项名为"通过预测下一个词元进行多模态学习的多模态大模型"的成果给出了肯定的答案。该成果 表明,只采用自回归路线,就可以统一多模态学习,训练出优秀的原生多模态大模型,这对于确立自回 归成为生成式人工智能统一路线具有重大意义。 (来源:千龙网) 值得一提的是,基于这一核心路径的迭代版本Emu3.5模型,已展现出对物理世界运行规律的初步学习 与模拟能力,能够尝试预测场景的下一步变化,为发展更通用、更接近人类认知方式的大模型与智能体 奠定了基础。 当地时间1月28日,北京智源人工智能研究院的一项突破性研究成果在国际顶级学术期刊《自然》 (Nature)上线,这是我国科研机构主导的大模型成果首次在《自然》正刊发表。 据悉, ...
又见印奇
36氪· 2026-01-27 08:25
文章核心观点 - 旷视科技联合创始人印奇基于AI 1.0时代商业化无法闭环的教训,认为AI 2.0时代必须找到明确的商业模式,其当前担任董事长的阶跃星辰选择“AI+智能终端”的软硬结合路径,旨在实现商业闭环,并已获得超过50亿元人民币的融资 [1][3][4][6][7] AI 1.0时代的教训与反思 - 旷视科技在AI 1.0时代是资本宠儿,曾获得7500万美元C轮融资并拥有高人才密度,但商业化上被认为不够主动饥渴 [1][2] - AI 1.0“四小龙”的共同宿命是缺乏自己的“印钞机”,无论如何商业都不能闭环,这对创始人伤害巨大 [2][3] - 印奇反思“拿着锤子找钉子”的模式,认为商业模式一旦试错很难回头,必须在3年内验证为合理的生意,商业闭环的结果比上市更重要 [3][4] 对当前AI商业化的观察与判断 - 不看好国内“六小虎”中大多数以及硅谷多数AI新贵的商业化,认为它们仍处于早期“拿着锤子找钉子”的阶段 [4] - 认为Google的Gemini能扳回一局是依靠搜索业务的“印钞机”,但其自身商业化也尚无清晰想法 [4] - 目前唯一看到成型且可能跑通的AI商业模式是xAI,因其与特斯拉结合,具备先天多模态和软硬结合基因,能服务企业客户 [5] 阶跃星辰的战略与商业模式 - 阶跃星辰获得超过50亿元人民币的新一轮融资,刷新了过去12个月国内大模型单笔融资规模记录 [6] - 公司战略是“AI与智能终端的结合”,旨在实现商业闭环,其“产品”是真正的硬件,而非单纯的AI代理 [7] - 公司放弃了“to 大B”的模式,认为在中国面向消费者的硬件产品才是实现商业闭环的路径,其to B收入已是“小虎”中最高的 [8][9][10] - 具体路径是用多模态基座模型能力服务手机厂商(实质是to C),并尝试推出未来形态的AI硬件 [10] 阶跃星辰的技术与团队 - 发布了Step3-VL-10B模型,仅100亿参数但在多项基准测试中碾压参数规模10-20倍的同行,部分能力可比肩GPT-4o等顶流闭源模型 [8] - 这种多模态能力出众的小参数模型是AI硬件的最佳搭档,可部署在端侧 [8] - 公司团队“骨骼清奇”,算法团队来自旷视,数据团队来自微软搜索,拥有顶尖研究人才,人才密度高且平衡 [12] - 公司有AGI信仰,目前是“多模态卷王”,计划在2026年使基座模型能力重返第一梯队 [13] 千里科技与协同愿景 - 印奇同时担任千里科技和阶跃星辰的董事长,两家公司合作密切 [6] - 千里科技围绕AI与车的关系,其目标是让千里智驾成为国内最好的智驾系统,跑在100万辆车上 [7][13] - 阶跃星辰与千里科技的协同,类似于xAI与特斯拉的关系,旨在通过软硬结合实现AI商业闭环 [5][7] 创始人的心态与理念 - 印奇自称已是“老登”,拥有“老灵魂”,信奉静水深流和长期主义,不再相信没有明确客户价值或商业价值的东西 [4][15] - 相较于“热血”,更强调商业闭环和交付离商业成果更近的成果 [14][15]
北京形成人工智能闭环式产业生态
北京商报· 2026-01-26 01:18
行业发展阶段与趋势 - 人工智能产业已从最初的技术探索与概念热潮,进入聚焦落地效能的务实发展阶段 [1] - 大语言模型的基础研发步伐趋于平缓,产业重心向应用端加速转移 [1] - 技术演进的一个突出趋势是从单智能体向多智能体系统演进,通过协同配合处理具体场景任务的效果显著优于单一智能体 [1] - 人工智能正加速从数字世界向物理世界延伸,技术从文字信息处理向多模态模型、世界模型升级,着力攻克时间空间认知、物理常识推理等核心难题 [1] 北京人工智能产业生态与规模 - 北京作为人工智能发展的核心阵地,凭借全栈式生态布局为产业发展提供支撑 [1] - 2025年预计北京市人工智能核心产业规模达4500亿元,企业集聚超2500家,两项指标均占全国半数左右 [2] - 领域内上市企业近60家、独角兽企业约40家,国内首个上市的国产人工智能芯片企业和大模型企业、估值最高的人工智能独角兽企业均诞生于北京 [2] - 人才方面,北京入围“AI 2000全球最具影响力学者榜单”的有148人,占全国超40%,AI学者总量达1.5万人,占全国30% [2] 产业驱动因素与未来展望 - 顶层设计提供接地气、全方位的政策支持,叠加从底层算力芯片、中间层技术研发到顶层场景应用的完整布局,形成了闭环式产业生态 [2] - 科研机构、企业与政策层面形成的合力,正推动多智能体等人工智能领域新技术、应用加速突破场景壁垒、迈向商业闭环 [2] - 行业对2026年成为中国智能体爆发的关键之年充满期待 [2]
2026北京两会|对话市政协委员王仲远:北京形成了人工智能闭环式产业生态
北京商报· 2026-01-25 19:17
行业发展阶段与核心趋势 - 人工智能产业经过三年快速发展,已从初期的技术探索与概念热潮,进入聚焦落地效能的务实发展阶段 [2] - 大语言模型等基础模型的研发步伐趋于平缓,产业重心正加速向应用端转移 [2][3] - 行业一个突出趋势是从单智能体向多智能体系统演进,通过多个智能体协同处理具体场景任务,其效果显著优于单一智能体,被视为技术深度融入实体经济的关键路径 [2][5] - 人工智能正加速突破数字世界边界,向物理世界延伸,技术从语言模型向多模态模型、世界模型升级,着力攻克时间空间认知、物理常识推理等核心难题 [2][5] 北京人工智能产业生态与优势 - 北京作为人工智能发展的核心阵地,凭借全栈式生态布局,形成了从底层算力芯片、中间层技术研发到顶层场景应用的完整闭环式产业生态 [2][3][5] - 2025年预计北京市人工智能核心产业规模达4500亿元,集聚企业超2500家,两项指标均约占全国半数 [3] - 北京人工智能领域有近60家上市企业和约40家独角兽企业,国内首个上市的国产AI芯片企业、大模型企业以及估值最高的AI独角兽企业均诞生于此 [3] - 人才优势突出,北京有148人入围“AI 2000全球最具影响力学者榜单”,占全国超40%,AI学者总量达1.5万人,占全国30% [3][5] - 拥有从顶尖高校到新型研发机构再到企业的完整人才培养与发展全链条,为人才提供了多样化的成长平台 [7] 政策支持与产业引导 - 北京的政策支持接地气且布局全面,既支持从0到1的颠覆式创新,也扶持前瞻性技术研发,同时助力企业推进场景落地,形成了全方位的支撑体系 [3][6] - 科研机构、企业与政策层面形成的合力,正推动多智能体等新技术加速突破场景壁垒、迈向商业闭环 [3] 未来发展方向与预期 - 行业当前更聚焦于务实解决问题,实现大模型的商业闭环被视为技术与产业实现高质量发展的关键 [9] - 未来核心方向是促进大模型落地应用,多智能体系统是重要抓手,有真实案例显示18个智能体组成的系统远超客户满意度 [8] - 对2026年成为中国智能体爆发的关键之年充满期待,建议通过开放政务等领域智能体技能库、开展竞赛等方式推动多智能体落地 [3][8] - 当大模型基础能力提升进入平缓期,便迎来了应用落地爆发的绝佳阶段 [9]
国内外AI应用冰火两重天-模型和应用的矛盾加剧
2026-01-20 09:50
行业与公司 * **行业**:半导体行业、人工智能(AI)行业 [1] * **公司**:台积电、Google、Anthropic、OpenAI、阿里巴巴、字节跳动、腾讯、美图、Roblox、Reddit、Figma、Adobe、帕拉蒂亚、第四范式 [1][2][4][12][13][15][16][21] 核心观点与论据 半导体行业趋势 * **台积电大幅上调资本支出**:对未来几年资本支出(CAPEX)增长预期达到30%至40%,为近年来最大上调,指引显示资本支出将达到500多亿美元,表明对未来两三年需求有较高信心,消除了短期内资本开支见顶的预期 [1][4] * **行业处于大扩产周期**:存储器价格上涨以及台积电扩产预期推动了半导体设备板块表现良好 [5] * **存储需求侧重点迁移**:存储需求正从训练侧向推理侧迁移,应用侧需要大量存储来调用上下文信息,这不仅体现在DRAM和HBM需求上,也反映在英伟达Roving架构中专门设计用于提高SSD与芯片共享速度的新接口,随着Agent市场发展,SSD需求将同步增长 [1][7][8] AI模型与技术进步 * **多模态模型实现质变**:以Google的NanoBanana为代表的多模态模型在2025年实现质变,从生成工具转变为真正生产力工具,大幅增加下游场景潜在可能性,例如编程中的浏览器自动化、GUI Agent读屏能力以及视频生成中的动作模仿 [1][6] * **多模态视觉模型提升环境理解**:使AI系统从“瞎子”变成能够“看见”外部世界,极大地拓展了下游应用可能性,特别是在机器人领域增强对外部环境理解能力,在医疗场景提升病例及影像读取能力,并增强了Agent执行连续任务的能力 [6][9] * **强化学习在垂直领域应用优势**:通过后训练和强化学习,将人类解决问题的思维方式嵌入模型,改变其参数,使其能像人类一样思考,这种方法对垂直场景的数据要求非常高,需要大量专家级数据标注,已成为发布智能代理(Agent)的一种普遍方式 [1][10][11] * **编程领域取得显著进步**:通过强化学习和后训练,编程Agent在2025年取得显著进步,实现了循环编程、自我调试和纠错等功能,并进入商业化普及阶段 [11] * **基础模型梯队格局**:全球最高水平的第一梯队是Anthropic、OpenAI和Gemini,第二梯队包括Grok、Gemini GML智谱产品以及kimi等 [6] 市场动态与竞争格局 * **中美AI应用市场表现分化**:中国市场的AI应用股票和美国以软件为代表的应用股票走势完全不同,美国市场中除了Google之外的大多数互联网公司和软件公司在8月份之后表现相对疲软,而上游公司则不断修正预期 [3] * **国内外市场关注点差异**:国内市场更关注C端发展,阿里、字节和腾讯主导前端流量竞争;海外市场则更关注To B业务发展 [1][12] * **国内AI生态特点**:国内市场具有生态闭环特点,模型与生态融合阻力较小,已基本完成底层联通,现在更多是如何将模型融入产品设计的问题 [12] * **国内巨头竞争策略差异**: * 字节通过豆包手机采用操作系统加APP模式,将所有AI功能集中于操作系统 [13] * 阿里的通义千问基于超级APP形式存在,后台接入自有生态(如飞猪、闪购),实现高颗粒度解析,每个小程序页面都能无缝跳转并嵌入回答内容中 [13] * 腾讯将小程序变成Agent,将所有AI功能下放给应用场景和小程序,实现链路连接 [13] * **国外主要AI公司现状**:OpenAI和Anthropic已成为百亿级别的公司,OpenAI在面向C端市场发力较少,Anthropic引起市场震动较大,目前美股平台公司中只有Google拥有自主模型 [15] * **美股软件板块下跌原因**:与OPS 4.5的发布有关,当Chatbot向Agent形态迁移时,Anthropic积累的全自动化工作流方式产生了更大影响,其Cloud Code和Cloud Coworker等新产品通过循环编程实现AI自行改正bug,大幅降低了软件开发成本并提高效率,从而引发市场震动 [17] 产品与投资 * **Anthropic产品创新**:Cloud Code和Cloud Coworker等产品通过循环编程实现AI自行改正bug,仅需人工进行产品设计,大幅降低了软件开发成本,并且能够模拟人眼进行界面交互,解决了后台无法执行工作的难题 [2][17][18] * **Google产品影响**:Google发布的自动生成节点编辑工具直接与Figma竞争,并对传统工作流工具如N8N产生重大影响,其推出的下游工具类产品主要面向C端或非专业用户 [16] * **阿里巴巴通义千问影响**:发布后将所有流量打包到同一个入口,整合自有流量,提高了产品解析能力,与竞品差别缩小,统一了流量入口并促进二线产品对头部业务的冲击,预计迭代速度会很快,对股价波动稳定性有积极影响 [14] * **投资标的建议**: * **平台类公司**:如Google、腾讯、阿里和快手,由于自有流量生态及自研模型能力,是较为明确的投资标的 [21] * **终端场景公司**:如美图、Roblox、Reddit等,受AI冲击较小,可通过Agent强化自身产品 [21] * **To B应用公司**:如Figma、Adobe等需要通过业绩证明自己不会被淘汰,而像帕拉蒂亚、第四范式这种专注垂直模型开发的公司相对受影响较小 [21] * **关注重点**:今年应重点关注各行业Agent的发展速度及落地效果 [21] 其他重要内容 行业挑战与观察点 * **存储器价格短期快速上涨**:因资源因素短期内快速上涨 [1][5] * **电力设备可能成为长期制约**:电力设备供给与产能问题可能成为长期制约因素 [1][5] * **下游厂商接受度是关键**:下游厂商对于存储涨价接受程度将在三四月份新品发布时成为关键观察点 [1][5] * **Agent层面进展**:去年(2025年)基础模型迭代没有显著跳跃式升级,但Agent层面通过强化学习取得重要进展,强化学习将知识库沉淀到模型中,使其具备类似肌肉记忆般规划工作流的能力,这一发展偏向垂直行业 [19][20] * **Anthropic潜力被低估**:Anthropic公司在Agent生态中的潜力被低估,其积累的模型和应用方式可能带来更大的颠覆性影响 [16]