开源模型
搜索文档
微软急了:西方以外的市场,中国领先
观察者网· 2026-01-13 18:30
文章核心观点 - 微软总裁警告,在争夺西方以外用户的竞争中,美国AI公司正被中国竞争对手超越,中国低成本的开源模型是一大优势,并已在多个新兴市场取得显著市场份额 [1] - 中国AI初创公司DeepSeek凭借其低成本、易用的开源模型,加速了AI在全球南方国家的普及,并改变了全球AI竞争格局,促使美国领先公司如OpenAI重新评估其封闭策略 [1][5][6] 全球AI市场竞争格局 - 中国在开源AI模型的全球市场份额方面已超越美国,这些模型通常免费供开发人员使用、修改和集成 [1] - 美国科技公司如OpenAI、谷歌和Anthropic专注于对其最先进技术保持完全控制,并通过客户订阅或企业合作协议获利 [1] - OpenAI首席执行官罕见承认公司在开源AI软件方面“一直站在历史的错误一边”,并透露内部正讨论公开AI模型权重,表明其战略可能发生重大转变 [6] 中国AI公司DeepSeek的市场表现与优势 - DeepSeek的技术在非洲等新兴市场快速普及,例如在埃塞俄比亚的AI市场份额为18%,在津巴布韦为17% [3] - 在美国科技产品受限制或禁运的国家,DeepSeek已取得相当大的领先优势,在白俄罗斯的市场份额为56%,在古巴为49%,在俄罗斯为43% [4] - DeepSeek-R1大模型仅用两个月完成训练,成本为550万美元,仅为美国公司所花费金额的一小部分,却实现了足以匹敌美国顶尖AI模型的效果 [5] - OpenAI首席执行官称赞DeepSeek的最新模型是“非常好的模型”,并坦承OpenAI未来的领先优势将比往年有所减少 [6] AI普及的全球差异与影响 - AI应用目前主要集中在发达国家,2025年第四季度,全球北方国家近四分之一的人口使用AI,而全球南方国家这一比例为14%,全球平均水平为16% [4] - 微软总裁认为,日益扩大的AI鸿沟“令人担忧”,如果不解决,很可能会加剧并扩大全球南北方之间巨大的经济差距 [4] - 在非洲等地区,由于负担不起昂贵的解决方案,用户主要选择开源系统,如Meta的Llama或中国的方案,以及本土的小型语言模型 [4] 行业竞争的关键因素与未来动向 - 低成本是竞争的关键优势之一,中国开源模型提供了廉价的替代方案 [1][3] - 美国公司被认为拥有更受信赖的声誉和更好的芯片,但“始终需要在价格上竞争” [4] - 微软总裁指出,美国与中国竞争的关键战场需要私营企业投入更多资金建设数据中心和提供技能培训,同时政府和金融机构也需要加大投资,特别是在电力成本补贴等方面 [3][4] - 预计DeepSeek将在近期发布其备受期待的新AI模型 [6]
黄仁勋的Agentic AI,闯入全球市值最高药厂
搜狐财经· 2026-01-13 16:03
英伟达与礼来的战略合作 - 英伟达与制药龙头礼来公司达成合作,共同投资10亿美元建立联合AI实验室,旨在融合顶尖科学家与AI研究员,共同推进从实验室到计算范式的根本性转变 [3] - 该合作将在未来五年投资10亿美元,合作范围涵盖临床开发、制造和实验室自动化,以加速科学新范式和药物发现 [25] - 合作基于一个信念:药物研发模式将从90%湿实验室/10%计算,在未来几年彻底翻转,从而加速突破 [25] 行业趋势与市场背景 - 2025年被视作代理式AI(Agentic AI)的爆发之年,其推理、工具调用及与遗留系统交互的能力已成熟 [5][7] - 医疗健康行业正率先大规模“雇用”AI Agent,以应对全球数千万的医护人力短缺,其技术部署和应用速度是美国经济整体速度的三倍 [5][12] - 美国医疗健康是一个价值4.9万亿美元的市场,正在以惊人规模部署AI [12] - 全球市值超过1万亿美元的公司共11家,英伟达(市值4.49万亿美元)和礼来(市值1.02万亿美元)占据两席,分别为全球最高市值公司和医疗健康板块市值最高公司 [5] 英伟达的医疗AI战略与产品布局 - 公司将其在医疗健康领域的AI模型和智能体产品组合开源,允许任何人进行修改和定制 [6] - 英伟达在2025年成为全球最大的开源AI贡献者,在Hugging Face上贡献了超过650个语言模型和250个数据集,涵盖生物学、化学、机器人技术和视觉等领域 [9] - 公司通过Clara模型系列专注于医疗健康领域的生物医学AI,覆盖从靶点发现到分子设计和医疗AI推理的全流程 [10] - 公司扩展了BioNeMo平台,并推出GPU加速的NeMo工具包,使化学处理速度快了100倍 [23] - 英伟达与实验室仪器巨头赛默飞世尔科技合作,构建“实验室基础AI基础设施”,推出基于IGX台式AI超级计算机的代理式系统,使实验室仪器能够集成并智能化 [18] 物理AI与机器人实验室自动化 - 物理AI迎来“ChatGPT时刻”,机器人/具身AI可在仿真数字世界中训练后再部署至现实世界,正对医疗健康和生命科学产业产生深远影响 [8] - 英伟达通过Cosmos世界基础模型和Isaac机器人平台,在仿真环境中训练机器人,以执行实验室任务,如质量控制、移液等,加速生物制造与研发 [6][19] - 新兴的机器人实验室自动化公司正在取得突破:例如,Multiply Labs使用Isaac平台训练机器人,将某些细胞疗法的制造成本从10万美元降低至3万美元(降幅超过70%),并在给定实验室面积内实现了100倍的吞吐量 [20] - Opentrons的液体处理系统已部署在全球10,000个实验室,并使用英伟达平台构建仿真环境以提高效率 [20] 代理式AI的具体应用与案例 - 代理AI正在被“雇用”作为数字同事,以弥补医疗服务与专业医疗人员之间的巨大缺口 [11] - Abridge临床对话AI平台每天为医生节省30%或更多时间,帮助生成报告和处理事前授权,已在超过200个医疗系统中部署 [13] - Corti、Speechmatics和Sully等平台正在部署分诊代理、登记代理等,以改善医院工作流程和患者体验 [13] - 在药物研发领域,ConcertAI帮助分层临床试验并模拟结果;IQVIA部署代理式系统以提高商业团队效率和加速临床试验构建 [14] - AI科学家代理可以阅读文献、设计实验、调用工具(如蛋白质结构预测模型)甚至启动物理实验,例如Edison AI科学家能在约16小时内完成一名研究员原本需要4到6个月的工作量 [15] 生物学AI与药物发现进展 - 行业正处于生物学的“Transformer时刻”的开端,AI驱动的制药革命正在进行,AI赋能的药物开始进入临床开发后期阶段 [8][21] - 英伟达通过开源模型如La Protina(原子尺度蛋白质设计)和RNA Pro(RNA设计)推动药物发现流程 [22] - Basecamp Research宣布其Eden平台,这是一个在10万亿个生物学“词元”上训练的GPT-4规模生物学模型,在抗菌和癌症领域取得突破性实验室验证结果 [24] 基础设施、成本与投资回报 - 英伟达从Hopper到Blackwell再到Rubin GPU平台,在过去四年里将推理成本降低了超过100倍(例如,从1美元降至0.01美元) [30] - 部署AI代理的投资回报率明确:例如,为医生释放30%的时间意味着可多看30%的病人或改善医生工作生活平衡;有公司衡量其平台为医疗系统“归还”了相当于57年的时间 [31] - AI计算基础设施被视为与道路、电力同等重要的国家基础设施,主权AI(如国家级的医疗健康云)是一个每年200亿美元的市场机会,英伟达预计每个主要经济体都会进行类似建设 [31]
吴恩达最新研判:算力封锁?中国模型抢占17%份额,开源AI完成“反向突围”?
钛媒体APP· 2026-01-13 15:12
中国AI大模型市场增长与全球地位 - 2024年中国大模型市场规模突破200亿元,复合增长率超40% [1] - 中国开源模型的全球下载量占比达17.1%,已反超美国的15.8% [1] - 从2024年底到2025年,中国开源模型在特定领域的全球使用量从1.2%激增至近30% [3] 中国AI领军企业及发展路径转变 - 行业格局由阿里Qwen、DeepSeek、智谱GLM及月之暗面Kimi等领军企业主导 [2] - 中国企业从国内市场竞争转向向全球开发者输出“AI基建”,海外主流开发平台已接入中国模型 [2] - 中国AI已完成从“应用层模仿”到“底层基座输出”的关键跃迁 [3] 技术发展策略与效率革命 - 在高端算力受限背景下,中国企业被迫在算法效率上寻找突破口,催生了“效率革命” [4] - 以DeepSeek为代表的企业采用混合专家(MoE)架构,将单次推理成本压缩至美国同类模型的数分之一 [4] - 中国模型在Token经济学上建立护城河,率先实现“性能与成本的最优解” [4] 开源与闭源的生态路线之争 - 美国模式以OpenAI和Google为代表,坚持闭源,试图通过API构建封闭的商业闭环 [5] - 中国模式选择了Apache 2.0协议的极度开放路径,公开权重并允许商用 [6] - 中国开源力量的崛起旨在打破硅谷巨头的垄断预期,成为全球AI生态多样性的关键变量 [6] 未来行业趋势与核心竞争力演变 - 未来的决胜点在于Agentic Workflow(智能工作流)的构建 [7] - 实验证明,采用迭代工作流的80分模型表现优于追求一次性输出的90分模型 [8][11] - 未来核心竞争力将从“拥有最强模型”转移到“构建最强工作流”,职场将分化为被动的工具使用者和主动的“逻辑架构师” [9]
2025,AI行业发生了什么?
经济观察报· 2026-01-12 19:48
文章核心观点 AI行业在2025年进入“下半场”,发展重点从单纯追求模型规模和算力,转向重新定义问题、重塑评估方式及探索更优发展路径[4]。行业呈现出多模态融合、具身智能爆发、算力竞争升级、范式争议涌现、智能体崛起、开源生态繁荣、商业模式革新、治理规则博弈、大国竞合加剧以及年轻技术领袖掌权等十大趋势,标志着AI技术正从能力展示阶段迈向与产业深度融合的效率兑现阶段[5][6][31]。 多模融合 - 多模态AI发展从“拼装式”组合方案转向设计“原生多模态”模型,从训练之初就让模型在统一体系内处理文本、图像、音频、视频等信息[8] - 下一代AI的突破重点在于构建对真实世界的内部模型,即“世界模型”与“空间智能”,使AI能进行可推理、可行动的统一表征,并在脑中“预演”行动后果[9][10] - 多模态模型成为头部企业主战场,能力从“能看图”推进到“看得准、看得全、看得懂流程”,并能将视觉理解转化为可执行动作,越来越多地介入真实任务本身[10] - 据Gartner预测,到2030年,**80%** 的企业软件将在其产品中植入多模态AI能力[10] 具身爆发 - 具身智能(Embodied AI)在2025年真正走向市场,行业叙事从“能不能做到”转向“规模化、稳定工作、进入岗位”[12] - 国内外企业如宇树、优必选、波士顿动力、Apptronik等明确宣布产品进入量产与商业化试点阶段,按“百台级”、“千台级”规划供应链[12] - 据IDC估算,2025年全球在仓储、制造、巡检等岗位的试点应用,较2024年增长了**数倍**[12] - 人形机器人成本显著下降,据美国银行研究院数据,典型价格已降至每台约**3.5万美元**,比2023年下降至少**40%**[13] 算力竞争 - 算力竞争从“规模导向”的资本驱动资源争夺,升级为“效率导向”的长期综合博弈[16] - 部分公司如谷歌通过自研TPU芯片,在核心模型训练中大规模替代GPU,以降低对英伟达的依赖并构建自主算力体系[16] - 算力设施全面“基础设施化”,智算中心围绕AI负载设计,网络拓扑以并行训练为核心,选址需评估电力、能耗与时延[17] 范式争议 - 理论界对持续投入算力的理论基础——“规模法则”出现系统性反思,认为单纯扩大自回归大模型不会自然通向通用智能,且面临收益递减[19] - 反对者(如杨立昆、安德烈·卡帕斯、伊利亚·苏茨克维)认为未来突破更可能来自训练范式、数据结构与推理机制的创新,而非参数规模本身[19][20] - 支持者(如德米斯·哈撒比)认为规模仍是多模态和复杂推理任务的重要前提,通向更高智能需在世界模型、规划与推理结构上进行方向修正[20] 代理崛起 - AI智能体(Agent)在2025年崛起,代表产品如Manus,能够理解目标、拆解任务、调用工具并执行操作,全程无需人工干预[22] - 智能体改变了人机交互方式,从“人去找功能”转向“任务驱动系统”,显著降低了学习和使用成本[22] - 智能体的成熟得益于大模型推理能力增强以及MCP、ANP、A2A等协议使工具调用与外部系统接入标准化[23] - 智能体将重组业务流程,使组织结构从围绕“人”设计转向围绕“任务”组织,商业模式可能从按调用量付费转向按任务与结果付费[23] 开源盛世 - 开源模型在2025年从边缘力量演变为全球创新的基础设施,在性能、生态与采用率上全面逼近甚至部分超越闭源模型[26] - 近两年新发布的大模型中,开源或“开放权重”模型已占据多数,在私有部署、微调和智能体等场景中占据主导[26] - 中国力量在开源生态中表现突出,以DeepSeek与Qwen为代表的模型在工程效率、推理成本与可部署性上形成优势,2025年全球开源模型使用中,中国来源已接近**三成**[27] 商业革新 - AI行业在2025年摸索出新的商业路径,形成分工清晰的产业生态,从单一技术竞赛转向“效率兑现”[29][31] - 技术底层:算力、训练与推理被标准化为可计量的“生产要素”,通过算力租赁、API与推理服务形成稳定收入,单位成本下降、单位调用价值上升[30] - 平台服务层:“结果作为商品”(OaaS)模式崛起,定价转向按任务、流程或结果收费,成为利润潜力最大、竞争最激烈的地带[30] - 应用层:垂直行业价值释放,AI深度嵌入软件开发、企业运营、金融分析等业务流程,成为企业的长期系统投入[30] 规则博弈 - AI治理在2025年全面展开,核心矛盾在于创新与规则之间的横向张力,以及不同制度体系之间的纵向博弈[33] - 治理从“静态合规”转向“动态校准”,通过分层、分阶段、可调整的方式(如“沙盒”、“分级管理”)与技术演进保持同步[33] - 全球主要经济体治理路径分化:美国倾向将治理视为“护栏”,优先关注国家安全与极端风险;欧盟强调通过系统化规则塑造发展方向;中国强调发展秩序与场景适配,规则与产业推进同步调整[34] 大国竞合 - AI国际竞争从企业层面上升到国家层面,围绕技术路径定义权、芯片与算力供应链掌控权以及标准制定权展开[36] - 美国在核心技术(如问题定义权、模型性能)和高端芯片设计、软件生态上保持主导[36] - 中国路径强调在既有技术框架下,通过工程优化、系统集成和真实场景反馈,在训练效率、算力调度、具身智能与产业级应用上形成优势[36] - 欧盟通过基础研究网络、跨国科研项目与评测体系在关键概念与方法论层面保持影响力[36] - 竞争格局呈现“高强度竞争中的有限合作”,较量核心在于谁能构建并长期运转一整套技术与产业体系[37] 少帅掌兵 - 2025年AI行业出现年轻科学家被赋予指挥权的趋势,一批三十岁出头甚至二十多岁的技术领袖开始直接影响公司工程架构与战略路径[38][39] - 代表性案例包括腾讯任命27岁的姚顺雨为首席AI科学家,小米启用“95后”罗福莉负责核心研发,Meta引入Scale AI创始人亚历山大·王担任首席AI官[39] - 这一趋势反映了AI进入“下半场”后发展逻辑的变化:技术边界从把模型做大转向重新定义问题与评估方式,更需要来自一线、敢于快速试错的年轻技术派[4][39]
2025人工智能发展现状报告:超级智能与中美大模型PK,限制与超越 | 企服国际观察
钛媒体APP· 2026-01-12 13:39
报告概览与核心预测 - 报告为《人工智能现状报告 2025》,长达300多页,由业界顶尖从业者评审,涵盖技术、产业、政策、安全、市场等多个维度[2] - 报告对下一年度做出多项预测:中国研究机构在前沿AI模型研究上将超越美国;开放式AI智能体(Agent)更值得获得进一步科研发现;基于AI生成欺诈视频的网络攻击将引发国际讨论;美国某头部AI研究架构将转向开源生态以获得政府支持[2] 技术发展与模型竞争 - 2024年末至2025年,随着GPT-o1发布,基于深度推理的大模型发展热潮兴起,多家厂商快速面世多个推理模型[3] - 以Meta为代表的科技巨头定义了“超级人工智能”(Superintelligence)一词,“通用人工智能”(AGI)成为过去时[3] - 顶尖模型仍保持闭源,如GPT-5、GPT-o3、Gemini 2.5 Pro、Claude 4.1 Opus、Grok4等,其中OpenAI的GPT-5在多个基准测试中保持领先[5] - 中国基础模型虽未取得突破性进展,但在开源模型领域颇具竞争力,DeepSeek、Qwen和Kimi等模型崛起,在推理和编程任务方面正逐步缩小与领先者的差距[6] - 开源为中国厂商提供了快速追赶的契机,越来越多的开发者选择基于Qwen进行开发[6] - 曾作为开源模型标杆的Meta Llama,其市场份额已从2024年末的约50%大幅下滑至目前的15%[6] - 近期推理模型的方法改进完全处于基准模型的误差范围内,可能意味着其进步并不真实,且强化学习带来的实际收益微乎其微,容易过拟合[9] - 前沿AI实验室正探索将强化学习、可验证奖励机制、可验证推理与新环境结合,赋予模型规划、反馈、自我修正及长期执行任务的能力[11] - AI研究正考虑利用小语言模型构建智能体,因其成本显著降低且能满足实际操作需求,策略是采用小语言模型构建有限的异构智能体架构,仅在必要时调用大模型[11] AI智能体与产业应用 - AI智能体框架发展迅速,LangChain仍是众多选择之一,各细分领域涌现数十种框架,如研发领域的AutoGen、camel,软件工程领域的MetaGPT等[13] - AI智能体的研究正赋予其记忆能力,实现从拓展上下文窗口到结构化、持久性终身记忆的转变,并延伸至动态整合、遗忘和反思[13] - AI在跨学科领域应用价值凸显,例如DeepMind基于Gemini 2.0构建的AI系统“Co-scientist”能生成、辩论并进化其假设生成与实验规划过程[13] - AI在物理世界涌现,如艾伦人工智能研究所的MolmoAct和谷歌的Gemini Robotics 1.5,能提升物理机器人的可解释性和可靠性[13] - AI产业应用迅速普及,AI优先企业营收远超其SaaS同行,在各个行业展现出发展势头[13] - 2025年,随着AI采用率上升,用户留存率上升,企业支出增加,特别是在音视频、虚拟形象、图像生成领域,AI公司收入有望实现爆发式增长[13] - 企业内部AI应用场景以内容生成、代码生成、研究及分析密集型任务最为常见[18] - 使用频率最高的工具包括ChatGPT、Claude、Gemini/Google和Perplexity,DeepSeek覆盖率略低但使用频率相对较高[18] - 在开发者工具中,Cursor、Claude Code和GitHub Copilot备受青睐;非编程工具中,Deep Research、ChatGPT、ElevenLabs、Perplexity和Claude使用频率非常高[18] - 对1183名AI从业者的调研显示,95%的专业人士现在在工作或生活中使用AI,76%的人自掏腰包购买AI工具,且大多数人表示生产力持续提高[25] 市场竞争、风险与基础设施 - AI编程工具可能主动覆盖企业生产代码,导致开发成果受损[21] - 从事AI编程开发的初创公司面临严峻的单位经济效益挑战,盈利受制于上游模型价格和竞争对手,可能采取突然提价或限制用户功能等措施[21] - 浏览器正成为AI应用的最新焦点和企业竞争的新战场,OpenAI、Google、Anthropic和Perplexity均推出了能在浏览器中导航和操作的助手功能,将浏览器重新定义为智能操作系统[21] - 谷歌在其产品中嵌入Gemini能力,其每月Token消耗数量在2025年同比增长了50倍,达到千万亿个Token[22] - 电力供应正成为制约AI发展的新因素,若电力供应不足,国家AI计划将面临崩溃风险,未来1-3年内美国几个主要地区可能会出现电力短缺[22] - 美国能源部警告,由于电力供应不稳定和AI需求增长,到2030年,停电频率可能会增加100倍[22] - 2024年末DeepSeek搅动市场,市场重新认识“杰文斯悖论”,即更便宜的智能带来更高的需求,进而提高对芯片的消耗[22] - GPU至关重要,英伟达市值突破4万亿美元,占据90%的AI研究论文市场份额,定制芯片与新云服务同步崛起[25] - 除英伟达外,上市公司Coreweave、Nebius以及私企Lambda、Crusoe因客户对优惠价格、灵活合同条款及AI专用软件套件的需求增加而实现快速增长[25] - TPU和AMD的GPU普及程度并不高[25] 劳动力市场影响 - AI主要挤压入门级岗位市场,在软件和客服领域,这类岗位极易受AI技术影响,其招聘岗位持续下降,经验丰富的劳动力暂时保持工作稳定性[25] - 研究发现当前劳动力市场变化早于2022年ChatGPT的问世,AI自动化目前并未削弱经济领域对认知型劳动力的需求[28] 政策、安全与监管 - 美国推行“美国AI优先”战略并调整出口政策,中国加速推进自主研发与本土芯片制造,中美AI竞赛愈演愈烈[28] - 2025年,特朗普政府将人工智能安全研究所更名为人工智能标准与创新中心,并启动了5000亿美元的“星门计划”,同时美国政府发布《人工智能行动计划》力求保持其全球主导地位[28] - AI芯片出口限制政策用“反复”形容,美国政府需在国家安全目标与供应链依赖、供应商游说间寻求平衡,英伟达和AMD成为政治焦点,英伟达在中国市场并未达到稳定状态[28] - 美国监管措施在巨额投资浪潮中被边缘化,国际外交陷入僵局,《人工智能法案》实施遭遇重重阻碍[31] - AI数据中心建设陷入邻避主义瓶颈,美国公众对新建大规模数据中心的反对声日益高涨[33] - 政府《人工智能行动计划》提及需自主AI领域“基础科学”,但其核心研发资金远低于专家建议的2026年320亿美元投资目标[33] - 硅谷科技巨头采取“逆向”并购政策:通过快速引进人才(创始人及团队高薪)以规避并购限制,同时保留原业务精简的公司转型拓展小众市场,例如微软收购Inflection,谷歌收购Character AI,亚马逊收购Adept,Meta收购Scale AI[33] - 美国联邦贸易委员会对这类“逆向”并购行为的担忧日益加剧[35] - 美国就AI安全相关的政策议题发生转变,加之实验室间商业竞争激烈,某些安全规程已被列为非优先事项[36] - 外部安全机构年度预算甚至不及顶尖实验室单日总支出,曾以安全为核心的机构开始将重点转向产品化[36] - 报告估算,外部AI安全研究投入仅约1.3亿美元,而同期全球AI研发支出接近千亿美元,比例极低[36] - AI实验室为防范生物安全风险和网络攻击部署了空前防护,部分实验室却因错过自我设定的截止日期或悄然放弃测试方案[36] - 网络攻击能力每五个月翻一番,远超防御措施的更新速度,犯罪分子利用AI智能体的勒索软件已渗透至世界500强企业[39] - 涉及生成式AI的安全事件正呈急剧增长态势,大量报告事件涉及AI换脸技术,与大模型的滥用密切相关,AI代理正日益成为网络安全防御的重大挑战[39]
具身开源模型新王!千寻Spirit v1.5模型登顶 RoboChallenge,终结 Pi0.5领跑时代
量子位· 2026-01-12 08:37
Spirit v1.5模型性能表现 - 千寻智能的具身智能基础模型Spirit v1.5在RoboChallenge真机评测榜上,以总分66.09、成功率50.33%的成绩超越美国公司Physical Intelligence的Pi0.5,登顶榜首[1] - Spirit v1.5是RoboChallenge自上线以来,首个击败基准模型Pi0.5的国产具身模型,同时也是首个在该榜单上成功率超过50%的具身智能模型[3] - 在“寻找绿盒”任务中,Spirit v1.5的成功率达到90%,显著领先于Pi0.5的80%和Pi0的70%[11][12] - 在“水果入篮”任务中,Spirit v1.5以80%的成功率领先Pi0.5(40%)整整一倍[14] - 在“贴胶带”任务中,Spirit v1.5以20%的成功率实现对比Pi0.5(10%)的翻倍领先[20] - 在“插花”任务中,虽然Spirit v1.5与Pi0.5成功率均为50%,但Spirit v1.5的稳定性更高,没有出现极端的失败案例[16] 技术路径与数据策略 - Spirit v1.5的核心创新在于预训练阶段的数据策略,从高度精选、强控制的“干净数据”转向多样化、开放式、弱控制的数据采集范式[33][34] - 开放式采集鼓励数据采集员围绕任务目标自由行动,而非遵循固定流程,使数据连续覆盖抓取、插入、整理、双臂协作等大量原子技能[40][41][43] - 该数据策略带来工程收益:人均有效采集时长提升约200%,对算法专家深度介入的需求降低约60%[45] - 消融实验显示,在预训练数据规模一致的前提下,采用多样化预训练的模型在新任务上达到相同性能时,所需迭代次数减少约40%[47] - 研究表明,对具身模型而言,任务多样性比单一任务的演示数量更为关键,模型学到的是可迁移的通用策略[52] RoboChallenge基准测试平台 - RoboChallenge由Dexmal原力灵机联合Hugging Face发起,是首个在真实物理环境中由真实机器人执行操作的大规模、多任务基准测试,被誉为具身智能的“ImageNet”[8][25] - 其Table30任务集通过30个高频桌面及周边日常场景,从视觉语言动作模型难点、机器人形态、任务流程与物体属性等维度考察模型真实世界通用操作能力[25] - 平台采用远程机器人范式,参赛者通过HTTP接口向机器人发送控制指令,显著降低参赛门槛,并使不同算法能在同一套真实硬件条件下接受统一评测[27][29] - 平台区分任务特定与通用型两种训练协议,榜单中带有“/multi”后缀的模型遵循更具挑战性的通用型设定[32] 公司背景与行业影响 - Spirit v1.5的研发团队千寻智能成立于2024年1月,是一家具备AI+机器人全栈技术能力的具身智能公司,常被称为“中国版Figure”[57][58][59] - 公司创始人兼CEO韩峰涛为机器人行业连续创业者,曾主导交付超2万台工业机器人;联合创始人兼首席科学家高阳为清华交叉信息研究院助理教授,其提出的ViLa算法被Figure采用[61] - 2025年,千寻智能完成超15亿元融资,其中PreA+轮由京东领投6亿元[61] - 公司通用人形机器人“小墨”已于2025年底在宁德时代电池产线规模化落地,精细作业成功率突破99%[61] - Spirit v1.5同步开源了模型权重、推理代码及使用样例,其登顶成绩及开源举措意味着技术进展被放入开源体系,旨在与社区共同推动具身智能发展[7][56][68][71]
Llama 4被图灵奖得主曝作弊刷榜,Meta开源AI帝国一夜倾覆
钛媒体APP· 2026-01-11 19:49
文章核心观点 - Meta公司因Llama 4模型在基准测试中作弊及内部管理混乱、技术路线摇摆而陷入危机 导致其首席科学家杨立昆离职、FAIR团队被裁 公司正放弃长期坚持的开源战略 转而孤注一掷地开发名为“Avocado”的闭源模型 其2026年的AI命运将取决于此款模型能否成功 [1][2][3][4][21][22] Meta内部管理与技术路线问题 - Meta前首席科学家杨立昆证实 团队为优化Llama 4的基准测试结果 对不同评测使用了不同版本的模型 结果被篡改 [1][4] - 杨立昆离职源于与公司在大语言模型技术路线上存在根本分歧 他信奉世界模型 而公司则全力投入大语言模型 [4] - FAIR前技术总监田渊栋及其团队被裁 他指责Llama 4的研发是“外行领导内行” 并透露自己是在项目发布前2个月被临时拉来“救火” [2][8][14][15] - 田渊栋自嘲接手项目后 最终结果超出了他预想的四种可能 而是得到了“被裁掉”的第五种可能 [17] - 公司内部管理混乱 从Llama 3末期开始 高层过度强调“技术产品化” 急于将AI整合进各应用 导致研发资源严重向多模态和应用适配倾斜 忽视了底层推理能力 [13][15] - 公司曾研究思维链技术 但因FAIR与产品组缺乏良性互动及高层痴迷“技术产品化” 导致自研成果被埋没 错失先机 [15] 核心团队变动与战略转向 - 杨立昆已于2025年年底离职 [4] - 2025年7月 公司以约4年3亿美元的薪酬包与顶级资源挖来OpenAI研究员Jason Wei与Hyung Won Chung [19] - 公司以143亿美元收购Scale AI 49%的股权 并扶持其28岁的创始人Alexandr Wang成为Meta首席人工智能官 [19] - 扎克伯格亲手拆解了耗时十年建立的科研体系 裁撤旧体系并重金引入外部人才 [18][19][20] - 随着Llama 4溃败 公司基本宣告放弃长期开源战略 转向开发闭源模型“Avocado” [2][21] - 公司正从“理想主义开源先锋”向“务实闭源追随者”转型 在行业中的位置从引领者滑落为焦虑的追赶者 [21] Llama系列模型的兴衰与行业竞争 - Llama 2和Llama 3曾是该公司的骄傲 凭借开源策略在AI界受到尊重 Llama 3在多项指标上能与GPT-4竞争 [12][13] - Llama 4推出后表现不佳 社区开发者怀疑其宣称的性能靠“刷榜”取得 [17] - 外部竞争加剧 OpenAI推出基于思维链的o1模型 中国的DeepSeek以MOE架构横空出世 具备强悍推理能力与极低成本 打破了硅谷大厂的成本壁垒 [15] - 公司新模型“Avocado”放弃了纯粹自研路径 试图融合谷歌Gemma、OpenAI的技术亮点 并被曝使用阿里巴巴的通义千问进行优化 [2][21] 未来展望与风险 - 2026年春季Avocado的发布将是决定公司AI成败的关键 如果这款“博采众长”的闭源模型无法实现性能突破 公司可能在超级智能的竞赛中彻底掉队 [3][22] - 公司将AI命运几乎全部压在了拼凑而成的Avocado模型上 [3]
2025,AI行业发生了什么?
经济观察报· 2026-01-10 17:01
文章核心观点 2025年是AI行业发展的里程碑之年,行业在技术、商业、产业和治理等多个维度经历了深刻变革,从技术范式的革新和商业逻辑的重构,到产业应用的落地和全球规则的博弈,标志着AI正从能力展示阶段迈向效率兑现和成熟发展阶段[2] 多模融合 - AI大模型从“拼装式”多模态方案转向设计“原生多模态”模型,从训练之初就在同一体系内处理文本、图像、音频、视频等信息[4] - 多模态模型的瓶颈在于能否将视觉、语言、时间与空间组织成可推理、可行动的统一表征,“世界模型”与“空间智能”成为重要理论依据,模型目标从回答问题转向介入真实任务[5] - 多模态AI成为新一代AI系统的关键底座,据Gartner预测,到2030年,**80%**的企业软件将植入多模态AI能力[6][7] 具身爆发 - 具身智能(Embodied AI)在2025年真正走向市场,行业叙事从“能不能做到”转向规模化、稳定工作和进入岗位,宇树、优必选、波士顿动力、Apptronik等企业产品进入量产与商业化试点阶段[8] - 人形机器人成本显著下降,根据美国银行研究院数据,典型人形机器人价格已降至每台约**3.5万美元**,比2023年下降至少**40%**[9] - 需求增长由原生多模态AI发展补足机器人理解能力短板,以及制造业、物流等领域用工成本持续抬升共同驱动,IDC估算显示2025年全球在仓储、制造等岗位的试点应用较2024年增长数倍[8][9] 算力竞争 - 算力竞争从“规模导向”转向“效率导向”,决定差距的不再是算力总量而是如何将有限算力转化为有效能力,国产模型DeepSeek通过多维并行等策略在更低投入下做出接近性能被视为象征[10] - 部分开发者开始直接介入芯片环节以降低对GPU的依赖,例如谷歌的TPU已在核心模型训练中大规模替代GPU[10] - 算力设施全面“基础设施化”,2025年的智算中心围绕AI负载设计,网络拓扑以并行训练为核心,选址需评估电力、能耗与时延[11] 范式争议 - 理论界对持续算力投入的理论基础“规模法则”提出反思,“图灵奖”得主杨立昆等研究者指出单纯扩大自回归大模型不会自然通向通用智能,继续堆参数与数据只会带来收益递减[12][13] - 规模法则仍有拥护者,认为以大模型为核心的路线能力边界仍在扩大,尤其在多模态和复杂推理任务上规模仍是重要前提,DeepMind联合创始人认为通向更高智能的关键在于世界模型等结构,是在规模基础上的方向修正[13] - 争议双方都对现有范式有所不满,这种争议可能推动AI界重新审视既有思路,寻找更优发展路径[13] 代理崛起 - AI智能体(Agent)在2025年崛起,代表案例是初创公司Monica的Manus,它能自动调用外部工具完成简历筛选、股票分析等复杂任务,随后被Meta以数十亿规模收购[14] - 智能体带来了人机交互方式的变化,从“人去找功能”转向“任务驱动系统”,用户只需提出目标,系统便自动规划路径,显著降低了学习和使用成本[14] - 智能体的出现是大模型在推理、多模态等能力增强,以及工具调用协议标准化共同作用的结果,使AI第一次具备跨步骤、跨系统完成任务的可行性[15] 开源盛世 - 2025年开源模型在性能、生态与采用率上全面逼近甚至部分超越闭源体系,在多份权威报告中,新发布的大模型中开源或“开放权重”模型已占据多数,在私有部署、微调等场景中占据主导[16] - 中国力量在开源生态中格外醒目,以DeepSeek与Qwen为代表的模型在工程效率、推理成本上形成优势,相关统计显示2025年全球开源模型使用中,中国来源已接近**三成**[17] - AI创新分工结构正在重组,基础模型更像底层平台,真正的创新越来越多发生在模型之上的微调、工具链与行业应用中,开源成为降低门槛、加速扩散的现实机制[17] 商业革新 - AI行业在2025年摸索出新的商业路径,形成分工清晰的产业生态,在技术底层,算力、训练与推理被标准化为可计量的“生产要素”,通过算力租赁、API等服务形成稳定收入[18] - 在平台服务层,“结果作为商品”(Outcome-as-a-Service, OaaS)模式崛起,定价从“功能售卖”转向按任务、流程或结果收费,成为利润潜力最大、竞争最激烈的地带[18] - 在应用层,垂直行业的价值被逐步释放,AI正深度嵌入软件开发、金融分析等业务流程,成为企业的长期系统投入,商业逻辑从“能力展示”转向“效率兑现”[19] 规则博弈 - AI治理在2025年全面展开,治理逐渐从“静态合规”转向“动态校准”,通过分层、分阶段、可调整的方式与技术演进保持同步,治理对象从单个模型延伸到数据、算力等完整链条[20] - 全球治理呈现不同制度体系间的纵向博弈,美国倾向将治理视为“护栏”,优先关注国家安全与极端风险;欧盟强调通过系统化规则塑造发展方向;中国更强调发展秩序与场景适配,规则与产业推进同步调整[21][22] - 治理博弈是AI迈向成熟的标志,如何在创新开放性与规则约束之间形成动态平衡,将决定AI能否长期、稳定嵌入社会结构[22] 大国竞合 - AI国际竞争从企业层面上升到国家层面,中美欧形成彼此错位、高度纠缠的竞争格局,美国在核心技术层面掌握最强话语权和“问题定义权”[23] - 中国的路径更强调在既有技术框架下,通过工程优化、系统集成和真实场景反馈,在训练效率、算力调度、具身智能与产业级应用等方面形成优势[23] - 竞争围绕芯片与算力供应链以及标准制定权展开,美国依托技术领先形成“事实标准”,中国在大规模部署中形成“用出来的标准”,欧洲则试图通过制度化规则在国际标准体系中发声[24] 少帅掌兵 - 2025年AI行业出现年轻科学家被赋予指挥权的趋势,例如腾讯任命27岁的姚顺雨为首席AI科学家,小米启用“95后”科学家罗福莉,Meta引入Scale AI创始人亚历山大·王担任首席AI官[25][26] - 这一趋势背后是AI发展逻辑的变化,行业进入“下半场”,核心从“解决问题”转向“提出什么问题、如何衡量进步”,这种能力往往出现在长期浸泡在一线研究的年轻技术派身上[26] - “少帅掌兵”是产业进入深水区后的结构性调整,当技术范式更不确定时,组织更需要愿意快速试错、敢于在不完全信息下判断的人,年轻科学家开始直接影响公司战略与技术路径[26]
别再相信AI恋人了,它们连自己都养不活
格隆汇· 2026-01-10 01:24
公司上市表现与核心数据 - 2026年1月9日,Minimax登陆港交所,盘中一度涨超110%,收盘市值突破1000亿港元 [1] - 2025年前三季度,公司营收5343.7万美元,同比增长超170% [1] - 海外市场收入占比高达73.1%,其中新加坡和美国分别贡献24.3%和20.4%的收入 [1] 海外收入结构与质量 - 海外收入呈现“C端主导、B端补充”格局,C端收入占比超71% [2] - C端收入主要依赖两大产品:AI情感陪伴产品Talkie/星野(收入占比35.1%)与AI视频生成工具海螺AI(收入占比32.6%) [2] - 增长高度依赖营销投放,2024年营销费用高达8699.5万美元,投放素材量突破10万条 [2] - 2024年AI原生产品毛利率为-8.1%,2025年前三季度才勉强转正至4.7% [2] - B端开放平台覆盖100多个国家及地区的13万企业客户,日均处理超万亿Tokens请求 [2] C端产品面临的挑战 - AI情感陪伴产品面临严重的用户留存困境,用户月均使用天数普遍低于5天 [3] - Talkie/星野的次日留存率仅41.91%,低于同期猫箱57.32%的均值水平 [3] - 2024年8月Talkie海外单月下载量达235万,但2025年四季度月活用户环比暴跌60% [3] - 海螺AI所在的AI视频生成赛道面临激烈竞争,Runway市场份额已下降40%至20%,而快手Kling家族模型快速抢占30%全球市场份额 [4] - 海螺AI的56美元ARPU值看似亮眼,但用户生命周期价值(LTV)尚未经过长期验证 [4] B端业务的局限性与行业对比 - B端业务模式为通过开放API接口输出全模态模型能力,但面临技术壁垒有限和生态协同不足的挑战 [5] - 随着DeepSeek、千问等开源模型崛起,企业客户可选择的替代方案增多 [5] - 与腾讯、字节跳动等企业的合作多为单点技术授权,未形成深度绑定的生态闭环 [5] - 对比聚焦中东市场的Neuxnet,其2024年营收近3000万美元,AI业务毛利率稳定在60%以上,而Minimax的B端业务更像是C端业务的补充 [5] - Minimax开放平台的客户流失率在2025年二季度上升至8.7%,而Neuxnet的客户续约率稳定在85%以上 [13] 增长动力与财务健康状况 - 营收增长存在明显基数效应:2023年营收346万美元,2024年同比激增782.1%至3052.3万美元 [7] - 2025年前三季度营收5343.7万美元,同比增长超170%,但增长动能衰减,三季度营收环比增速仅15.3%,较二季度的32.7%大幅下滑 [7] - 2024年营销费用占营收比例高达284.9%,远超行业平均水平(海外AI应用厂商普遍低于50%) [7] - 2022年至2025年前三季度,公司累计净亏损达12.5亿美元 [8] - 2025年前三季度研发费率高达337.4%,研发开支1.8亿美元 [8] 技术、模式与全球化运营短板 - 公司强调是“全球唯四全模态进入第一梯队”的大模型公司,但与GPT-4、Gemini的差距仍在6-12个月 [10] - 开源模型(如DeepSeek-R1、千问2.0)在多模态能力上快速追赶,性能达闭源模型的80%以上,部署成本仅为闭源模型的1/5 [12] - 企业客户使用开源模型的综合成本仅为调用Minimax API的30% [12] - 全球化运营停留在“产品出口+远程服务”阶段,缺乏深度本地化能力 [13] - 在东南亚市场,因未适配当地主流支付方式,付费转化率仅为1.2%,远低于行业平均的3.5% [13] 面临的版权、竞争与合规风险 - 2025年9月以来,核心产品海螺AI被迪士尼、环球影业等版权方起诉,索赔金额达7500万美元 [15] - 竞争对手优势明显:Character.AI在AI情感陪伴赛道的用户规模是Talkie/星野的3倍,付费率达8.7%;Runway占据全球AI视频生成市场45%的份额 [16] - 国内竞争对手如字节跳动的即梦AI,2025年三季度海外收入同比增长210%,分流了Minimax在东南亚的用户 [16] - 全球AI监管政策收紧,如欧盟《人工智能法案》和美国加州的《生成式AI透明度法案》,大幅提升合规成本 [17] - 仅满足欧盟《人工智能法案》的合规要求,预计需新增研发投入超5000万美元,年合规维护成本将占营收的15%以上 [17] 行业洞察与中国AI企业出海路径 - 2025年中国AI核心产业规模预计达8200亿元,生成式AI用户渗透率升至36.5% [18] - 全球AI应用出海访问量突破76亿次,中国企业占据半壁江山 [18] - 中国AI企业出海应借鉴Neuxnet经验,选择需求刚性、付费能力强的垂直B端赛道,如中东的数字化基建、东南亚的电商数字化 [18] - 应弱化对“全模态”“大参数”的盲目追求,转向“开源模型+行业定制”的轻量化路径 [19] - 深度本地化是核心竞争力,应在核心海外市场设立本地化团队,招聘本地员工,Neuxnet核心团队本地化率达40% [19] - 版权合规与技术出口合规是出海的两大底线,需建立合规的训练数据体系和技术出口内部审核流程 [20]
周鸿祎预言2026年将迈入“百亿智能体时代” AI竞争焦点从参数转向落地
中国经营报· 2026-01-09 17:16
2026年AI产业核心趋势 - 2026年将被定义为“百亿智能体之年”,AI竞争焦点从“比拼参数”转向“比拼落地”,社会处于技术架构到组织形态全方位变革的临界点 [1] 基础设施与算力格局 - AI产业动力发生根本性转移,企业不再频繁训练大模型,而是通过“推理应用”直接“雇佣”AI解决实际问题 [1] - 高频、长流程的推理任务推动算力需求呈现“短期百倍级”增长,其规模与增速全面超越训练算力 [1] - 芯片市场从“英伟达一家独大”的单极格局转向“训练主导、推理多元”的双轨格局,专用推理芯片(ASIC)凭借成本优势快速渗透 [1] - 能源供给取代算力成为核心瓶颈,全球科技竞争升级为“能源大战” [1] - 中国依托“东数西算”国家工程与绿色电力能力,已占据先发优势 [2] 模型技术演进与生态 - 2026年AI模型完成从“静态工具”到“持续进化系统”的蜕变,传统“预训练+微调”模式让位于“通用基座+行业专精+推理时进化”新范式 [2] - 企业愿为更长推理时间付费,以换取更高决策准确性 [2] - 以DeepSeek、通义千问为代表的中国开源模型正成为全球AI根技术生态核心,对全球智力资源形成“虹吸效应” [2] - 开源推动AI从科技巨头特权转变为全球普惠基座,助力“一带一路”国家构建“主权模型” [2] - 端侧AI迎来爆发,离线决策设备成为AI安全“最后防线” [2] 社会融合与组织变革 - AI将具备成熟长期记忆能力,进化为个人“第二大脑”,成为意识延伸与数字孪生 [2] - 在工作场所,“硅基数字员工”被正式纳入用工体系,与人类组成“碳基+硅基”混合团队 [2] - 组织形态因此极度扁平化,管理者从“指挥官”转型为“业务教练” [2] - 掌握“行业Know-how”并转化为AI可学习知识的企业将构筑最深竞争护城河 [2] - 个体层面,能精准定义问题并指挥智能体的“创造者(Builder)”成为职场核心,“超级个体”时代开启 [2] 经济模式与安全范式 - 百亿智能体融入经济循环,重写商业规则与安全边界,人类商业迎来第三次跃迁,进入“智能体间自动化经济” [3] - 智能体替代APP成为服务核心入口,个人与商家智能体可直接谈判、交易 [3] - 需建立硅基规则体系,包括身份认证、区块链合约及“AI原生保险”等金融创新 [3] - AI安全从“选修课”变为“生死红线”,必须构建全流程可追溯系统,关键决策点保留“人在回路”否决权 [3] - 面对协同攻击,安全防御需升级为“以模制模”范式,即用“宪兵模型”监控“业务模型”,网络安全进入“自动驾驶”时代 [3] 中国AI发展机遇 - 中国凭借完备的产业链、坚实的算力与能源基础、活跃的开源生态,完全有能力把握“百亿智能体”时代的战略机遇 [3]