Workflow
多模态模型
icon
搜索文档
AI应用投资机会梳理
2026-01-13 09:10
行业与公司 * **行业**:人工智能(AI)应用行业,特别是生成式AI、大语言模型(LLM)和多模态模型领域 [1] * **公司**:涉及多家国内外公司,包括: * **海外**:OpenAI、谷歌(Google)、Anthropic、迪士尼(Disney)、Stripe [1][2][3][8][21] * **港股/中概股**:阿里巴巴、快手、美图、富博集团、百度、智谱、Minimax、kimi、昆仑芯、蓝标、中文在线、天涯秀 [1][2][6][9][17] * **A股/游戏公司**:世纪华通、巨人网络、心动网络、完美世界、凯英投资、利欧、值得买、引力传媒、智文互联、阅文 [10][12][13][15][16][17] 核心观点与论据 AI行业发展趋势与市场动态 * **模型迭代加速**:大语言模型(LLM)迭代速度加快,2024年SOTA模型约半年更新一次,到2025年已提升至季度级别 [1][2] * **性能脉冲式提升**:模型性能通过范式革新实现脉冲式提升,例如GPT-3.5通过预训练、GPT-4通过后训练和强化学习带来显著能力飞跃 [2] * **新研究方向涌现**:在线学习或终身学习成为新方向,使模型能持续学习新知识 [1][3] * **多模态模型潜力巨大**:多模态模型处于早期阶段(相当于LLM的GPT-2.5水平),但未来跨越式发展潜力更大 [1][3] * **AI成为重要流量入口**:OpenAI的周活跃用户(WAU)在2025年底已接近10亿,预计到2026年底可能达到20亿,ChatGPT等已从小众流量池演变为可与谷歌搜索媲美的重要流量入口 [1][3] * **市场规模高速增长**:2025年AI市场规模约为200亿,且仍在高速增长 [12] * **迎来大规模资本化元年**:自2025年下半年起,国内AI投融资显著升温;智谱和Minimax已在港股上市,kimi、昆仑芯等计划上市;海外OpenAI和Anthropic也有上市计划,其中OpenAI目标估值高达1万亿美元 [2][9] 国内外市场差异与商业化 * **国内外付费习惯差异**:海外C端订阅模式(如ChatGPT)在国内较难推广,国内用户在某些方面付费意愿较低;B端应用在国内收费也存在困难 [1][4] * **国内潜在机会领域**:在教育等增值服务领域,国内用户仍表现出付费意愿,存在收入增长机会 [4][5] * **OpenAI商业化新举措**: * 大幅上修2026-2029年营收预期,特别是免费用户变现收入 [1][8] * 探索电商(上线Merchants功能,与Stripe合作)和广告(在回答中优先显示赞助内容)两种免费用户变现方式 [8] * 计划在2026年实现30亿美元的免费用户变现规模,到2029年提升至250亿美元 [1][8] 具体公司分析与投资机会 * **阿里巴巴**: * **AI应用**:2025年Q4成立千万事业群,推出的千问、灵光、蚂蚁阿福在2025年12月均进入国内AI原生应用TOP 10 [7] * **云计算业务**:发展稳健,是国内最完备的模型算力平台场景闭环综合性平台;收入增长引擎分为AI(挖掘国内存量客户需求)和出海(聚焦东南亚、中东市场)两部分 [2][19] * **自研芯片**:平头哥PPU有望放量,优化算力成本结构 [19] * **近期表现与前景**:2025年Q4电商侧(淘天、闪购)业绩不尽人意,但预期差已落地;云计算业务可对冲电商阶段性疲软;当前价格进入“击球区” [19][20] * **快手**: * **AI应用**:利用AI改进内容推荐算法;旗下多模态产品“可灵”处于全球第一梯队 [2][6][17] * **估值与前景**:当前PE仅13倍,主营业务稳健;可灵估值相对保守,2026年将受益于模型迭代的高流水预期及Minimax上市带来的估值范式修复;AI红利将内生到广告和电商转化漏斗中逐步兑现 [17][18] * **富博集团**: * **业务模式**:从事内容版权保护,约45%收入来自SaaS订阅服务(如迪士尼),约56%来自增值服务(监测二创视频盗版并参与广告分账) [21] * **增长逻辑**:AI多模态应用发展导致二创视频数量大幅增加,可监测活跃内容资产数量逐季度加速增长,将推动增值服务收入增速;作为第三方中立机构,在角色授权监测与盗版甄别方面价值凸显 [2][21] * **美图**: * **竞争优势**:凭借C端垂直应用对精细化需求的快速捕捉和迭代能力(如每月推新功能)占据优势,互联网巨头迭代周期长且不倾向于过度投入精细化布局 [6][22] * **挑战与应对**:生成式AI算法用于提升会员购买和付费渗透率;尽管面临巨头竞争,但其C端垂直应用产品仍具生存价值,影像多模态商业价值肯定,未受大模型更新迭代明显影响 [22][23] * **游戏行业**: * **AI应用现状**:多数游戏公司已在研发和发行中采用AI降本增效;但利用AI创造行业增量的原生游戏仍未完全实现;2026年腾讯、网易、米哈游等大厂新产品将AI作为核心玩法 [14] * **A股公司估值**:大部分头部A股游戏公司2022年PE估值仍不到20倍,估值水平未被高估 [15] * **值得关注的公司**: * **世纪华通**:出海产品数据稳中有升,新赛道产品流水环比增长较高;具备休闲游戏基因,出海空间巨大 [15][16] * **其他公司**:巨人网络、心动网络、完美世界、凯英投资均有表现良好或备受期待的产品 [16][17] AI应用发展方向 * **基于生成式模型优化(GEO)的AI营销**:利用生成式模型带来的新流量入口提供新营销方案,相关公司包括蓝标、利欧、值得买等 [10] * **AI陪伴**:如Minimax的“星野(Talkie)”、凯英投资的产品“易物(Eve)”,结合游戏化体系(抽卡、皮肤)商业上限很高 [10][11] * **AI加IP/AI漫剧**:结合IP与AI技术,带来新娱乐体验 [11] * **AI+动漫产业**:AI技术可提升中游动漫制作环节生产力,解决产能紧张问题,从而放大上游IP价值,阅文和中文在线等公司表现突出 [12][13] 其他重要内容 * **迪士尼与OpenAI合作**:迪士尼将200多个智能决策(角色)授权给Sora进行AI建模,体现了AI与顶级IP的结合趋势 [3][21] * **投资建议逻辑**:所提及的港股公司(阿里巴巴、快手、美图、富博)分别代表了垂直场景的AI多模态应用、全栈自研互联网巨头以及第三方内容版权机构,均是春季AI应用催化下值得关注的方向 [23]
2025,AI行业发生了什么?
经济观察报· 2026-01-12 19:48
文章核心观点 AI行业在2025年进入“下半场”,发展重点从单纯追求模型规模和算力,转向重新定义问题、重塑评估方式及探索更优发展路径[4]。行业呈现出多模态融合、具身智能爆发、算力竞争升级、范式争议涌现、智能体崛起、开源生态繁荣、商业模式革新、治理规则博弈、大国竞合加剧以及年轻技术领袖掌权等十大趋势,标志着AI技术正从能力展示阶段迈向与产业深度融合的效率兑现阶段[5][6][31]。 多模融合 - 多模态AI发展从“拼装式”组合方案转向设计“原生多模态”模型,从训练之初就让模型在统一体系内处理文本、图像、音频、视频等信息[8] - 下一代AI的突破重点在于构建对真实世界的内部模型,即“世界模型”与“空间智能”,使AI能进行可推理、可行动的统一表征,并在脑中“预演”行动后果[9][10] - 多模态模型成为头部企业主战场,能力从“能看图”推进到“看得准、看得全、看得懂流程”,并能将视觉理解转化为可执行动作,越来越多地介入真实任务本身[10] - 据Gartner预测,到2030年,**80%** 的企业软件将在其产品中植入多模态AI能力[10] 具身爆发 - 具身智能(Embodied AI)在2025年真正走向市场,行业叙事从“能不能做到”转向“规模化、稳定工作、进入岗位”[12] - 国内外企业如宇树、优必选、波士顿动力、Apptronik等明确宣布产品进入量产与商业化试点阶段,按“百台级”、“千台级”规划供应链[12] - 据IDC估算,2025年全球在仓储、制造、巡检等岗位的试点应用,较2024年增长了**数倍**[12] - 人形机器人成本显著下降,据美国银行研究院数据,典型价格已降至每台约**3.5万美元**,比2023年下降至少**40%**[13] 算力竞争 - 算力竞争从“规模导向”的资本驱动资源争夺,升级为“效率导向”的长期综合博弈[16] - 部分公司如谷歌通过自研TPU芯片,在核心模型训练中大规模替代GPU,以降低对英伟达的依赖并构建自主算力体系[16] - 算力设施全面“基础设施化”,智算中心围绕AI负载设计,网络拓扑以并行训练为核心,选址需评估电力、能耗与时延[17] 范式争议 - 理论界对持续投入算力的理论基础——“规模法则”出现系统性反思,认为单纯扩大自回归大模型不会自然通向通用智能,且面临收益递减[19] - 反对者(如杨立昆、安德烈·卡帕斯、伊利亚·苏茨克维)认为未来突破更可能来自训练范式、数据结构与推理机制的创新,而非参数规模本身[19][20] - 支持者(如德米斯·哈撒比)认为规模仍是多模态和复杂推理任务的重要前提,通向更高智能需在世界模型、规划与推理结构上进行方向修正[20] 代理崛起 - AI智能体(Agent)在2025年崛起,代表产品如Manus,能够理解目标、拆解任务、调用工具并执行操作,全程无需人工干预[22] - 智能体改变了人机交互方式,从“人去找功能”转向“任务驱动系统”,显著降低了学习和使用成本[22] - 智能体的成熟得益于大模型推理能力增强以及MCP、ANP、A2A等协议使工具调用与外部系统接入标准化[23] - 智能体将重组业务流程,使组织结构从围绕“人”设计转向围绕“任务”组织,商业模式可能从按调用量付费转向按任务与结果付费[23] 开源盛世 - 开源模型在2025年从边缘力量演变为全球创新的基础设施,在性能、生态与采用率上全面逼近甚至部分超越闭源模型[26] - 近两年新发布的大模型中,开源或“开放权重”模型已占据多数,在私有部署、微调和智能体等场景中占据主导[26] - 中国力量在开源生态中表现突出,以DeepSeek与Qwen为代表的模型在工程效率、推理成本与可部署性上形成优势,2025年全球开源模型使用中,中国来源已接近**三成**[27] 商业革新 - AI行业在2025年摸索出新的商业路径,形成分工清晰的产业生态,从单一技术竞赛转向“效率兑现”[29][31] - 技术底层:算力、训练与推理被标准化为可计量的“生产要素”,通过算力租赁、API与推理服务形成稳定收入,单位成本下降、单位调用价值上升[30] - 平台服务层:“结果作为商品”(OaaS)模式崛起,定价转向按任务、流程或结果收费,成为利润潜力最大、竞争最激烈的地带[30] - 应用层:垂直行业价值释放,AI深度嵌入软件开发、企业运营、金融分析等业务流程,成为企业的长期系统投入[30] 规则博弈 - AI治理在2025年全面展开,核心矛盾在于创新与规则之间的横向张力,以及不同制度体系之间的纵向博弈[33] - 治理从“静态合规”转向“动态校准”,通过分层、分阶段、可调整的方式(如“沙盒”、“分级管理”)与技术演进保持同步[33] - 全球主要经济体治理路径分化:美国倾向将治理视为“护栏”,优先关注国家安全与极端风险;欧盟强调通过系统化规则塑造发展方向;中国强调发展秩序与场景适配,规则与产业推进同步调整[34] 大国竞合 - AI国际竞争从企业层面上升到国家层面,围绕技术路径定义权、芯片与算力供应链掌控权以及标准制定权展开[36] - 美国在核心技术(如问题定义权、模型性能)和高端芯片设计、软件生态上保持主导[36] - 中国路径强调在既有技术框架下,通过工程优化、系统集成和真实场景反馈,在训练效率、算力调度、具身智能与产业级应用上形成优势[36] - 欧盟通过基础研究网络、跨国科研项目与评测体系在关键概念与方法论层面保持影响力[36] - 竞争格局呈现“高强度竞争中的有限合作”,较量核心在于谁能构建并长期运转一整套技术与产业体系[37] 少帅掌兵 - 2025年AI行业出现年轻科学家被赋予指挥权的趋势,一批三十岁出头甚至二十多岁的技术领袖开始直接影响公司工程架构与战略路径[38][39] - 代表性案例包括腾讯任命27岁的姚顺雨为首席AI科学家,小米启用“95后”罗福莉负责核心研发,Meta引入Scale AI创始人亚历山大·王担任首席AI官[39] - 这一趋势反映了AI进入“下半场”后发展逻辑的变化:技术边界从把模型做大转向重新定义问题与评估方式,更需要来自一线、敢于快速试错的年轻技术派[4][39]
粤开市场日报-20260112
粤开证券· 2026-01-12 15:38
核心观点 - 报告为一份市场日报,核心观点是当日A股市场全线上涨,呈现普涨格局,成交额显著放大,科技成长板块表现尤为强势 [1] 市场回顾 - **指数表现**:A股主要指数全数上涨,截至收盘,沪指涨1.09%,收报4165.29点;深证成指涨1.75%,收报14366.91点;创业板指涨1.82%,收报3388.34点;科创50指数涨2.43%,收报1511.84点 [1][10] - **个股与成交**:全市场个股涨多跌少,4141只个股上涨,1179只个股下跌,144只个股收平;沪深两市合计成交额36014亿元,较上个交易日放量4787亿元 [1] - **行业板块表现**:申万一级行业涨多跌少,传媒、计算机、国防军工、社会服务和通信等行业领涨,涨幅分别为7.80%、7.26%、5.66%、3.21%和2.74%;石油石化、煤炭和房地产行业下跌,跌幅分别为1.00%、0.47%和0.29% [1][14] - **概念板块表现**:涨幅居前的概念板块包括Kimi、拼多多合作商、小红书平台、卫星互联网、ChatGPT、智能体、虚拟人、DeepSeek、中文语料库、AIGC、网红经济、抖音豆包、多模态模型、WEB3.0、商业航天;回调的概念板块包括锂电负极、央企煤炭、保险精选等 [2][12]
智谱唐杰:2025年可能是多模态模型的适应年
新浪财经· 2026-01-10 17:08
行业技术趋势 - 清华大学教授、智谱创始人唐杰预测2025年可能是多模态模型的失意年,很多多模态模型没有引起较多关注 [1] - 行业当前更多的研发重点仍在做文本智能上限的提升 [1] - 对于大模型而言,如何收集并统一感知多模态信息,即实现原生多模态模型,仍是一个技术短板 [1] 技术发展路径与类比 - 原生多模态模型的设计理念与人的感统系统相似,涉及整合视觉、声音、触觉等信息 [1] - 人的大脑存在感统不协调(感统失调)的问题,模型的下一个功能推进方向是在多模态信息统合与感知方面 [1]
粤开市场日报-20260109-20260109
粤开证券· 2026-01-09 15:48
市场整体表现 - 2026年1月9日A股主要指数普遍上涨,沪指上涨0.92%收于4120.43点,深证成指上涨1.15%收于14120.15点,创业板指上涨0.77%收于3327.81点,科创50指数上涨1.43%收于1475.97点 [1] - 市场呈现普涨格局,全市场3918只个股上涨,1344只个股下跌,201只个股收平 [1] - 沪深两市成交额合计31227亿元,较上个交易日放量3224亿元 [1] 行业板块表现 - 申万一级行业涨多跌少,传媒、综合、国防军工、计算机、有色金属等行业领涨,涨幅分别为5.31%、3.60%、3.29%、2.90%、2.78% [1] - 银行、非银金融行业下跌,跌幅分别为0.44%、0.20% [1] 概念板块表现 - 涨幅居前的概念板块包括拼多多合作商、小红书平台、Kimi、抖音豆包、WEB3.0、虚拟人、ChatGPT、AIGC、网红经济、稀有金属精选、多模态模型、短剧游戏、智能体、中文语料库、直播带货 [2] - 回调的概念板块包括硅能源、电源设备精选、光伏玻璃、保险精选、银行精选等 [2]
垂类AI应用专题:Minimax是全球化大模型公司,拥有大语言、视频、音频大模型
国信证券· 2026-01-05 22:54
报告行业投资评级 - 优于大市(维持)[1] 报告核心观点 - 大模型应用的商业化仍处于早期阶段,向Agent的演进是曲线拐点,商业价值将加速释放[2] - 多模态整合成为趋势,MiniMax拥有多模态模型能力,AI音频、视频模型能力突出,将受益于AI陪伴、AI视频、Agent等细分领域爆发[2] 公司概况与战略定位 - MiniMax是全球化的大模型公司,成立于2021年底,已累计服务超过200个国家及地区的超2.12亿名个人用户,以及超过100个国家及地区的10万余名企业客户[2][6] - 公司拥有大语言、视频、音频三模态大模型,AI视频和AI音频是全球第一梯队[2][6] - 公司具有前瞻性战略眼光,于2024年1月推出国内首款MoE大模型,并于2024年第二季度重点布局多模态[2][33] - 公司采用“极简高效”的运营模式,小团队干大事,员工平均年龄不足30岁,研发背景人员占比74%[33] - 创始人闫俊杰团队控股28.25%,阿里巴巴、米哈游、IDG资本、腾讯为主要外部股东[2][27][29] 市场地位与模型能力 - 根据2024年收入,MiniMax是全球第四大纯研发驱动的pureplay大模型技术公司,市占率为0.3%[42][44][46] - **大语言模型**:M系列聚焦高效编码与智能体协作,采用MoE架构和线性注意力机制以提升效率、降低成本[46][53] - 2025年12月底更新的M2.1模型,在多语言场景评测中已超过Claude Sonnet 4.5和Gemini 3 Pro,并接近Claude Opus 4.5[6] - M2.1较M2响应速度提升30%、Token消耗降低25%[53] - **视频生成模型**:海螺AI(Hailuo)定位高精度动态表现与低成本规模化创作[56] - 首创双版本策略,Hailuo2.3Fast生成速度提升3倍,成本降低60%[56] - 截至2026年1月3日,在Artificial Analysis全球文生视频榜单中排行第九,图生视频榜单中排行第五[2][56] - 在精准执行用户指令、处理复杂物理交互(如体操、跳水)方面表现出色[2][68] - **语音生成模型**:Speech系列具有超拟人效果,端到端延迟低于250毫秒,达到行业顶尖水平[2][6][59] - 截至2026年1月3日,在Artificial Analysis全球语音榜单中排行第二[2][59] - 支持40余种语言,具备30秒音色复刻能力[59] 业务模式与收入结构 - 公司以C端消费主导业务模式,AI原生产品收入占总收入比重为71%[2][24] - 海外收入占比73%,主要市场为新加坡(24%)、美国(20%)和中国大陆(27%)[2][7][10] - 主要收入来源为三大产品:Talkie/星野(AI陪伴)、海螺AI(AI视频)、开放平台(API),2025年前9个月收入占比分别为35%、33%、29%[2][20] - **Talkie/星野**:专注于实时人机交互的AI陪伴产品,受到欧美国家喜爱[2][78] - 截至2025年9月,累计用户1.47亿,月活跃用户2000万,同比增长62%[2][81] - 2025年前9个月收入1875万美元,同比增长39%,其中在线营销是主要收入来源[2][83][84] - **海螺AI**:性价比高的视频生成平台,订阅收入是主要来源[2][68] - 2025年前9个月收入1746万美元,活跃用户564万,付费用户31万[2][69] - 每秒视频生成价格约0.1元人民币,具有成本优势[68] - **开放平台**:提供多模态API服务,追求性价比[98] - 2025年前9个月收入1542万美元,同比增长160%[20][98] - 输入价格为0.4–1.3美元/百万Token,输出价格2.2美元/百万Token[98] 财务表现 - **收入高速增长**:2024年收入3052万美元;2025年前9个月收入5344万美元,同比增长175%[2][20][103] - **毛利率转正并提升**:2025年前9个月整体毛利率为23%,同比提升21个百分点[2][108] - AI原生产品毛利率从2024年同期的-24%提升至5%[2][108] - 开放平台毛利率为69%[108] - **亏损率大幅收窄**:2024年调整后净亏损2.44亿美元;2025年前9个月调整后净亏损1.86亿美元,调整后亏损率为349%[2][20][108] - **现金充足**:截至2025年9月,公司现金结余为10.46亿美元[20] - **客户集中度下降**:前五大客户营收占比从2023年的60.5%持续下降至2025年前9个月的21.7%[110][111] 行业市场前景 - 全球大模型市场处于商业化早期,向Agent演进是曲线拐点[2][41] - 根据灼识咨询,基于模型收入口径,全球大模型市场规模预计将从2024年的107亿美元增至2029年的2065亿美元[41] - 其中,大模型应用市场规模预计将从2024年的71亿美元增至2029年的1515亿美元,年复合增长率达84%[41]
华为开源7B多模态模型,视觉定位和OCR能力出色,你的昇腾端侧“新甜点”来了
量子位· 2026-01-05 13:00
华为推出开源多模态大模型openPangu-VL-7B - 华为推出开源新玩家openPangu-VL-7B,这是一款7B参数量的多模态大模型,直接瞄准端侧部署与个人开发者这一核心应用场景 [1][3] - 模型具备轻量化特性和强劲性能,能灵活适配各类终端场景,并覆盖图像信息抽取、文档理解、视频解析、物体定位等高频需求 [2] 模型性能与效率表现 - 模型为昇腾原生结构,在单张Ascend Atlas 800T A2卡上,对720P图像进行首字模型推理时延(ViT与LLM模型时延和)仅160毫秒,能够进行5FPS的实时推理 [4] - 模型在训练阶段的MFU达到42.5% [4] - 在预训练阶段完成了3T+tokens的无突刺集群长稳训练,为开发者使用昇腾集群提供了极具价值的实践参考 [5] 模型在核心任务上的基准测试表现 - 在通用视觉问答任务上,模型在MMBenchvl.I_DEV上得分86.5,在AI2Dics上得分84.7,在RealWorldQA上得分76.1,在MMStar上得分70.1 [8] - 在OCR与图表/文档理解任务上,模型在OCRBench上得分907,在TextVQA上得分85.1,在ChartQA上得分88.3,在DocVQAtest上得分96.0,在CharXivpo上得分83.9,在CharXivgo上得分54.3 [8] - 在STEM任务上,模型在MMMUval上得分65.2,在MMMU-Pro overall上得分52.6,在MathVistamini上得分75.0 [8] - 在多图像理解任务上,模型在BLINKval上得分63.3,在MUIRBench上得分61.6 [8] - 在视觉定位与计数任务上,模型在RefCOCO-avg上得分90.6,在ODinW-13上得分51.5,在Point-Bench上得分65.4,在CountBench上得分96.1 [8] - 在视频理解任务上,模型在MVBench上得分74.0,在VideoMME w/o sub上得分68.0,在MLVU上得分76.9 [8] 模型应用能力展示 - 官方提供的cookbook展现了模型在视觉定位、文档理解等领域的优异能力 [9] - 例如,给定一张菜品图,模型能够点出所有樱桃番茄的位置并正确计数 [10] - 给定一张年报截图,模型能将其转变为markdown格式,省去人工摘录 [12] 核心技术细节与设计创新 - 模型采用了适配昇腾的高性能视觉编码器,其架构深度为26,使用2D RoPE位置嵌入和GELU激活函数 [14] - 该视觉编码器在相同参数量下,在昇腾芯片上的吞吐较使用窗注意力的ViT-H系列编码器提升15% [15] - 采用多标签对比学习框架,让模型具备更优的细粒度理解能力,为后续视觉定位数据学习筑牢基础 [16] - 创新采用“加权逐样本损失+逐令牌损失”的混合训练方案,加权系数由令牌位置和样本重要性动态决定,解决了不同长度训练样本的学习均衡问题 [17][18] - 区别于业界主流的0-999定位方案,模型采用000-999千分位带填充相对坐标完成视觉定位,使用整齐的三个token进行位置回归,降低了学习难度并提升了格式遵从性 [20][21] - 技术报告还深入探索了预训练数据配比、位置编码、模型融合等关键策略,为开发者提供了全面的技术细节参考 [23] 对行业与生态的影响 - 对于昇腾使用者而言,openPangu-VL-7B的开源是一大利好 [24] - 这款兼具轻量化、高性能与强通用性的多模态模型,为端侧开发和个人使用提供了新选择,也将进一步丰富昇腾生态的应用场景 [24]
DeepSeek元旦发布新论文,开启架构新篇章;安克创新回应“裁员30%”;陈天桥再押注,中国首家超声波脑机接口公司成立丨邦早报
创业邦· 2026-01-02 09:09
脑机接口与神经科技 - 中国首家超声波脑机接口公司格式塔(Gestala)在成都成立,由前脑虎科技联合创始人彭雷与盛大集团创始人陈天桥联合创立,标志着中国启动了一条以超声技术为技术栈的新路线 [3] - 马斯克宣布Neuralink将于2026年开始大规模生产脑机接口设备,并转向精简、几乎完全自动化的外科手术流程,设备线程将穿过硬脑膜而无需移除 [10][12] - Neuralink在2025年已获得美国FDA针对严重言语障碍的言语恢复技术的突破性设备认定 [13] 新能源汽车交付数据(2025年12月及全年) - **理想汽车**:12月交付44,246辆,第四季度交付109,194辆,累计交付量已达1,540,215辆 [4] - **蔚来**:12月交付48,135辆,同比增长54.6%;第四季度交付124,807辆,同比增长71.7%;全年交付326,028台,创历史新高,同比增长46.9% [4] - **小鹏汽车**:12月交付37,508辆,同比增长2%;全年交付429,445辆,同比增长126% [4] - **小米汽车**:12月交付量超过5万台 [4] - **零跑汽车**:12月交付60,423台,同比增长42%;全年交付596,555台,同比增长103% [4] - **极氪**:12月交付30,267台,创历史新高,同比增长11.3%;全年总计交付224,133台 [5] - **岚图汽车**:全年累计交付150,169辆,同比增长87% [5] - **鸿蒙智行**:全年累计交付589,107台,同比增长32%;12月单月交付89,611台,连续三个月创月度交付历史新高 [5] - **赛力斯**:12月新车交付超57,000台,再创单月交付新高;2025年新车交付超42万台 [5] - **智己汽车**:2025年销量81,017台,全年销量再创新高 [5] - **广汽埃安**:昊铂埃安BU在12月销量40,066辆创新高,i60首月销量破万 [5] 人工智能与模型研发 - DeepSeek在元旦发布新论文,提出名为mHC(流形约束超连接)的新架构,旨在解决传统超连接在大规模模型训练中的不稳定性问题 [5] - 月之暗面计划在2026年1月或3月上线多模态新模型,型号或为K2.1/K2.5 [17] - OpenAI正整合团队升级其音频人工智能模型,为推出首款以音频交互为核心的人工智能硬件设备做准备 [17] - 智元具身研究中心推出第二代一体化具身大小脑系统GenieReasoner,并开源了ERIQ评测基准 [23] 消费电子与硬件 - 苹果将iPhone 11 Pro、Apple Watch Series 5及最后一款搭载Intel芯片的MacBook Air列为“过时产品” [17] - 报道称苹果因销售疲软削减了Vision Pro头显的产量和营销投入,2024年出货量达39万台,近期数字广告支出降幅超过95% [19] - 罗永浩确认将为“科技春晚”因技术故障延迟的门票进行全额退款,预计需要7-10个工作日到账 [18] 汽车行业动态 - 上汽大众宣布2026年将密集投放7款全新新能源产品,覆盖纯电、混动、增程动力形式,2025年全年终端销售106万辆 [17] - 小米汽车回应YU7配置调整,称下架部分配置是为了优化生产流程和提升交付效率,并承诺不影响已交付或已定车辆的售后维修备件供应 [19] - 起亚中国宣布对奕跑和K3车型实行全国一口价,分别为5.59万元和6.99万元 [19] 企业融资与战略 - AI应用产品ListenHub母公司MarsWave完成200万美元天使+轮融资,由天际资本领投,小米联合创始人王川跟投,公司年经常性收入(ARR)已突破300万美元 [23] - 安克创新回应“裁员30%”传闻称不属实,表示是基于战略升级和效率提升的正常人员调整,公司员工规模在5000人上下 [9][10] 机器人技术 - 稚晖君(彭志辉)发布公开信,正式推出全球首款全身力控小尺寸人形机器人“启元Q1”,并启动个人机器人共创“探索者计划” [25] 娱乐与电影产业 - 2025年度中国电影总票房为518.32亿元,同比增长21.95%;城市院线观影人次为12.38亿,同比增长22.57%;国产影片票房占比为79.67% [27] - 2026年元旦档(1月1日—1月3日)档期票房(含预售)突破3亿元 [29] 其他行业新闻 - 印度肯德基和必胜客运营商Sapphire Foods和Devyani International将以9.34亿美元的交易合并,合并后实体预计产生2334万至2501万美元的年度协同效应,两家公司在印度和海外经营着3000多家门店 [22] - SpaceX星链计划于2026年启动卫星星座调整工作,将所有运行在约550公里高度轨道上的卫星降至480公里高度,以提升太空安全水平 [22] - 搜狐创始人张朝阳在跨年演讲中强调科普应基于计算和数学,并指出未来物理研究和知识学习将与AI、新媒体结合以提高效率 [22]
2026年五大猜想:入口争夺大年
国盛证券· 2025-12-31 21:32
核心观点 报告认为,2026年将是人工智能技术持续突破、应用加速落地和硬件生态重构的关键一年,核心围绕“入口争夺”展开,AI将从数字世界(Digital AI)向物理世界(Physical AI)延伸,推动模型、应用、端侧硬件、自动驾驶及汽车产业边界发生深刻变革 [1] 一、模型能力:持续进化,为应用落地奠基 - **多模态能力持续增强**:2026年,AI模型在多模态推理与生成能力上将持续突破,海外由谷歌和OpenAI引领,国内阿里巴巴、字节跳动、快手、Minimax等厂商在视频生成等领域表现亮眼,例如快手Kling 2.5 turbo测评得分1225,略高于海外同代模型 [14][15][16] - **超长上下文处理能力提升**:上下文长度扩展是重要方向,Meta的Llama4 Scout支持10M级超长上下文,国内厂商如DeepSeek、智谱则通过“光学压缩”等技术提升上下文效率,这将支撑智能体长期任务执行和企业级复杂应用 [22][24][26] - **模型幻觉率显著降低**:头部模型正向低幻觉率演进,例如OpenAI的GPT-4系列幻觉率从早期的23.3%降至5.6%,DeepSeek V3.2降至5%左右,低幻觉率将推动AI在金融、医疗等专业领域加速落地 [29][30] 二、AI应用:2026年为流量入口争夺大年 - **C端入口竞争白热化**:竞争核心是打造覆盖N个App功能的统一超级入口,并实现硬件与生态的深度协同,例如阿里巴巴的千问APP计划接入地图、外卖等生活场景,字节跳动的豆包APP月活已达1.6亿,并推出豆包手机助手抢占硬件入口 [32][33][38] - **B端应用在三大领域率先规模化**:AI Coding、AI营销和AI for Science(AI4S)有望率先突破 - **AI Coding**:已成为企业级生产力工具,微软内部30%代码由AI生成,Meta预计2026年将达50%,Cursor公司的ARR在2025年内从1亿美元跃升至10亿美元,中国AI Coding市场规模预计从2024年的90亿元增长至2028年的330亿元,年复合增速38% [40][42][43] - **AI营销**:已覆盖投前、投中、投后全链条,例如阿里巴巴的阿里妈妈在2025年双11期间助力超20万商家成交增长20%,品牌平均ROI提升15%-20% [46][48] - **AI for Science**:在生命科学、材料科学等领域取得突破,例如谷歌DeepMind的AlphaFold已被全球190多个国家超过300万名科研人员使用,加速重大疾病研究 [49][50] 三、端侧智能硬件:迎来“安卓时刻”,百花齐放 - **手机/PC市场承压,折叠机是亮点**:因存储成本上涨,Trendforce将2026年全球手机和PC出货增速预测下调至-2%和-2.4%,但折叠机市场预计在2026年实现30%增速,到2029年复合增长率仍有望达17% [58][59][62] - **AI/AR眼镜赛道巨头云集**:2025年小米、阿里巴巴、理想汽车等巨头纷纷入场,IDC预测2026年全球智能眼镜出货量将突破2368.7万台,同比增长63.2% [64][67][70] - **具身智能(Physical AI)加速迭代**:在数据、模型、硬件三方面持续突破,谷歌推出Gemini Robotics 1.5系列,英伟达推出开源机器人基础模型GR00T N1,Trendforce预计2026年全球人形机器人出货量将突破5万台,年增逾700%,艾瑞咨询预计中国具身智能产业规模在未来10年有望从2025e的21亿元增长至2035e的2833亿元 [68][71][86][88] - **AIOT产品形态多样**:趋势包括从有屏到无屏交互(如AI Pin、智能戒指)、从功能到情感陪伴(如AI玩具)、从单品智能到生态协同(如小米智能中控屏) [90][91] 四、Robotaxi:规模化扩张与生态战开启 - **L4玩家进入规模化扩张**:以Waymo、萝卜快跑、小马智行、文远知行为代表的L4技术玩家凭借技术优势进入规模化阶段 [3] - **新势力与互联网厂商入局**:具有成本优势的特斯拉、小鹏汽车等正通过渐进式路径(L2→L3→L4)走向无人驾驶,具有流量优势的互联网厂商(如阿里系的哈啰、高德)通过生态合作进入市场,2026年将迎来各方阵营的生态战 [3] - **智驾配置快速升级**:为满足高阶智驾需求,硬件配置走向冗余,例如小鹏汽车计划在2026年搭载算力达3000 Tops的智驾芯片 [54][56] 五、汽车OEM:企业边界全方位拓展 - **硬件边界扩张**:整车厂正从汽车向机器人、智能眼镜、飞行汽车等领域拓展,例如特斯拉推出Optimus机器人,理想汽车发布Livis AI眼镜,小鹏、广汽等多家车企布局飞行汽车 [4][64][67] - **软件向AI Agent演进**:汽车软件正从“被动响应”向“主动服务”的AI Agent转变,旨在让汽车成为理解用户需求的智能体 [4] - **供应链垂直整合以寻求差异化**:面对激烈竞争,车企通过自研自制关键零部件寻求更高的平台化、更低的成本和更明显的产品差异化 [4]
从谷歌AI体系看应用叙事
2025-12-29 09:04
涉及的行业与公司 * **公司**:谷歌(Alphabet)、OpenAI、Anthropic、阿里、百度、字节跳动、Deepseek、三星、Perplexity * **行业**:人工智能(AI)、大模型、云计算、搜索引擎、消费电子、企业服务、互联网 核心观点与论据 谷歌AI模型的技术优势与进展 * **Gemini 3.0 Pro在多模态与长上下文领先**:支持文本、图片、音频、视频及PDF,上下文窗口达100万token,超越GPT 5.1的40万token和Claude 4.5的20万token,通过动态调整计算资源实现更拟人的慢思考效果[1][2][3] * **视频生成模型VO系列实现音画同步与精确调控**:VO 3.0是首个实现声音和画面原生同步直出的头部模型,VO 3.1新增对已生成视频的精确调控功能,单价为每秒0.4美元,与Sora R接近,分辨率达720P-1,080P[1][4] * **图像生成模型NanoBanana具备实时知识与精细操控**:基于Gemini开发,调用谷歌搜索接入真实世界知识,通过思维链机制理解提示词,具备高分辨率、文字渲染准确、图片精细操控等优势[1][7] * **用户使用时长反超ChatGPT**:截至2025年10月,Gemini APP和网页端单用户单次使用时长达到7.2分钟,超越ChatGPT的6分钟,下载量从年中每月1,500万次增至10月份6,600万次[1][5] 谷歌AI驱动的业务增长与市场布局 * **AI成为核心业务增长新动力**:2025年第三季度谷歌总营收1,023亿美元,其中搜索收入565亿美元,AI overview和AI mode提升了广告变现效率,云业务新增客户数同比增长34%[2][11] * **C端应用场景示范效应显著**:Google Search的AI模式日活人数超过7,500万,内置的AI Overview功能月活用户数超过20亿,大幅提升整体搜索收入[14] * **B端企业服务与硬件生态全面布局**:通过Vertex AI平台提供企业级解决方案,合同金额达1,550亿美元,付费企业用户数突破100万,在安卓生态(如安卓16)和C端硬件(手机、手表)中深度集成AI功能[10][12][14][16][18][23] * **深入垂直行业与合作伙伴**:将客户分为11个主要行业,吸引头部客户,例如三星Galaxy手机部署了Gemini和Imagen模型,三星家庭伴侣机器人也接入了谷歌AI[19][20] 全球及中国AI市场动态 * **AI搜索市场快速增长**:2025年,AI浏览器Perplexity访问量近乎翻倍,国内AI搜索用户量约5亿,日查询需求约20亿次,由阿里夸克、百度AI搜索等主导[2][15] * **国内大模型企业市场爆发**:2025年上半年,国内大模型企业市场总Token使用量日均达10.2万亿,同比增长超三倍,阿里通义、字节豆包及Deepseek调用最多,主要来自互联网和金融行业[2][21] * **国产大模型紧跟迭代,应用场景深化**:国产模型在思考深度、多模态处理及编程性能方面不断迭代,企业应用场景从智能问答(32%)转向价值更高的内容创作与客户服务等领域[22] * **操作系统层面AI化改造成为趋势**:谷歌在安卓16中内置大量Gemini AI功能,字节跳动的豆包手机也在操作系统层面进行了大量AI化改造[16][17] 其他重要内容 * **谷歌AI体系架构**:分为云计算、大模型及原生AI应用三大部分,核心研发部门是DeepMind人工实验室[10][12] * **模型收费与成本**:NanoBanana Pro按Token收费,每百万Token定价120美元,高于Gemini 3.0 Pro文本输出价格,每张图片平均消耗1,200至2000个Token[9] * **技术路径差异**:NanoBanana Pro采用多模态架构和思维链机制模拟物理世界,而GPT-4O基于统计相关性拼接像素图片[8] * **投资方向启示**:基于谷歌示范,创意领域多模态模型、C端硬件AI化、B端企业强付费意愿的AI应用被视为具有较大发展机会的方向[24]