Workflow
AGI
icon
搜索文档
深度解读 AGI-Next 2026:分化、新范式、Agent 与全球 AI 竞赛的 40 条重要判断
海外独角兽· 2026-01-13 20:33
文章核心观点 - 华人已成为AGI领域的重要力量,中国开源模型是全球Tier 1,预计到2026年地位将更加牢固[1] - 大模型行业正经历显著分化,主要体现在To B与To C场景、以及垂直整合与分层路线上[3] - 自主学习是行业共识性极强的新范式,预计2026年将成为主要投入方向[1] - Scaling(规模扩展)将继续,是技术、数据与品味共进的结果,探索前沿智能不会停止[1] - 模型即Agent,Agent即产品,两者趋于一体化[1] - 中美AI竞赛存在结构性差异,美国算力比中国多1-2个数量级,且更多投入下一代技术探索[1] 模型分化趋势 - 分化趋势显性,原因多元,包括To B和To C场景需求差异、对竞争格局的思考以及不同AI实验室的战略选择[1] - To B领域会出现强模型与弱模型的分化,且会越来越大[1] - To C场景的任务瓶颈往往不是模型不够大,而是上下文(Context)和环境(Environment)的缺失[1] - 在To C逻辑下,大多数用户大多数时候不需要很强的智能,模型智能提升的体验不强烈[3] - To C问题的解法在于真正的个性化数据,例如在合规前提下利用微信聊天记录等上下文,比追求更强预训练模型带来更大价值[3] - 在To B市场,用户(企业)愿意为“最强模型”付出溢价,因此强模型与弱模型的分化会越来越明显[3] - 例如,Opus 4.5这类强模型做10个任务能对8-9个,而弱模型只能对5-6个,即使后者更便宜,但企业因监控错误成本高而更倾向于选择强模型[4] - To C场景中,模型做All-in-one的垂直整合成立,模型与产品可强耦合迭代;而To B(生产力应用)因涉及多生产环节,给了应用公司优化空间,出现了模型公司与应用之间的分层[4] - 模型分化并非预设路线图,更多是自然演化的结果,通常源于与客户的高频交流[4] - 分化与模型竞争的时机相关,例如智谱AI押注Coding是基于对当时模型竞争格局(如DeepSeek出现后Chatbot取代搜索之战基本结束)的判断[5] 新范式:自主学习 - Scaling会继续,但需区分两种方向:Scaling已知路径(增加数据和算力)和Scaling未知路径(寻找新范式,让AI系统自己定义奖励函数、交互方法等)[5] - 当下AI社区对新范式尚无统一定义,自主学习、主动学习、持续学习等概念本质都预期模型能在人类不介入下提升智能[6] - Scaling Law被总结为一种将能源转化为智能的视角,核心在于高效逼近智能上限,是技术、数据与审美的共进[6] - 自主学习的目标是让模型具备自反思与自学习能力,通过持续的自我评估与批判来优化行为路径[6] - 新范式的发生是一个正在发生的“渐变”过程,2025年已出现信号,例如Cursor的Auto-complete模型每几小时用最新用户数据学习,ChatGPT利用用户数据拟合聊天风格,Claude Code写了自身项目95%的代码[6] - 新范式的最大瓶颈是想象力,即需要构想出证明范式实现的具体任务(如赚钱的交易系统或解决未解科学问题)[7] - 从更实际角度看,强化学习(RL)的潜力尚未被充分挖掘;下一代范式存在两个维度:自主学习和AI具备更强的主动性(未来模型可能不再需要人类提示,而是环境本身就能提示它)[7] - 主动学习会带来严重的安全挑战,风险不在于“讲不该讲的话”,而在于“做不该做的事”,因此必须为其注入正确的方向[7] - 自主学习能体现到个性化上,但衡量其是否“变好”会变得困难,因为当AI覆盖生活方方面面后,评估指标变得极其模糊[7] - 对于多Agent串联的长程任务,一旦Agent能力未达100%,后续能力往往呈指数级下降;人类通过睡眠“清理噪音”,AI可能需要探索类似的清噪与新计算模式[8] - 提出了“智能效率”(Intelligence Efficiency)概念,即关注投入多少资源能获得多少智能增量,这是解决成本瓶颈的关键[8] - 大模型发展路径借鉴人脑认知学习过程,而在多模态、记忆与持续学习、反思与自我认知这几类能力上,人类显著领先于当前模型,这些可能是新的突破方向[8] - 智谱AI在2020年参考人类认知规划了AI系统结构图,包含三个模块:系统一(模式匹配与知识提取)、系统二(知识融合与推理机制)、自主学习,分别对应数据与模型规模的Scaling-up、推理的Scaling、以及环境Scaling(让模型从与外界交互中获得反馈)[9][10] 原生多模态 - 原生多模态模型和人的“感统”相似,能汇集视觉、声音、触觉等信息,但当前模型的感统能力并不充分[11] - 多模态感统是智谱AI今年的重点方向之一,具备此能力后,AI才能在真实工作环境中执行长链路、长时效任务[11] - 多模态同样是Qwen持续要做的事情,认为真正智能的东西天然应该是多模态的,但存在多模态能否驱动智能的争论[11] - 从第一性原理出发,为模型提供更多生产力、更好帮助人类,做视觉、语音等多模态能力是自然而然的选择[11] - 视频是更广义的表达,图片可理解为单帧视频,理解很长视频是很有意思的事情[11] Agent发展 - Coding是通往Agent的必经之路,例如智谱AI的实践中,GLM-4.5虽跑分高但写不出“植物大战僵尸”游戏,通过引入RLVR和大量真实编程环境训练,GLM-4.7才解决了该问题[11] - 模型即产品,Agent要实现复杂任务对模型要求相当高,模型就是Agent本身,Agent就是产品本身,做基础模型也就是在做产品[12] - 模型To B和To C的分化同样体现在Agent上:To C产品的指标有时与模型智能不相关甚至相反;To B的Agent甚至不需要做太多创新,模型智能提升、解决真实世界任务能力提高就能创造更多价值[12] - 生产力场景的Agent才刚开始,除了模型进步,环境和部署同样重要,是Agent创造价值的关键:即使模型不再变好,只要把现有模型部署到各公司,也能带来10倍甚至100倍的收益,但今天AI对GDP的影响还远不到1%[13] - 教育非常重要,会使用AI工具的人正在替代那些不会使用工具的人[13] - 未来的Agent将变成“托管式”,用户设定通用目标后,Agent在后台长时间独立运行直至完成任务[13] - Agent要做到这一点离不开前面提到的自我进化以及主动学习,在此逻辑下,“模型即Agent,Agent即产品”[13] - 做通用Agent过程中,长尾任务更值得关注,用户感受到AI的价值与魅力往往因为某个长尾任务被解决,今天的所谓AGI本质上也在解决长尾问题[13] - 做通用Agent是见仁见智的问题,如果作为“套壳”方没有比模型公司做得更好的信息,那么通用Agent就是“模型即产品”的机会,因为对模型公司来说,很多工程问题可能只是“烧一烧卡”就可解决[14] - Agent发展可划分为四个象限,从两个维度看:目标定义(人为/自动)和任务规划(人为/自动);今天处于初级状态(目标与规划皆由人定义),未来会出现大模型观察人的工作并使用人的流程数据,最终目标与规划皆可由大模型定义,Agent应是大模型内生的原生系统[14] - 决定Agent未来走势的几个重要问题:是否能真正解决人类任务并创造价值及价值大小;Agent成本有多大(成本过高是问题,若调用API就能解决,模型厂商意识到价值大时就会自然做进去,这是基座模型与应用之间的矛盾);应用公司的迭代速度(若Agent团队有能力拉开半年时间窗口满足用户需求,就有机会持续往前走)[14][15] 全球AI竞赛 - 对于中国AI在3-5年内进入全球第一梯队持乐观态度,因为中国最大的优势在于一旦证明某件事可行,就有能力以极高效率复现、甚至做到局部更好[17] - 但长期视角中更核心的问题在于“敢突破新范式、敢冒险的人不够多”的文化差异,此外还需面对两个现实瓶颈:算力瓶颈(核心在于光刻机是否有突破)和是否能诞生更成熟的To B市场并在国际市场竞争(应更关注“正确的事”和用户体验,而非过分刷榜)[17][18] - 另一种观点认为,中国AI超过美国的概率最乐观情况为20%[18] - 中美AI之间算力差异不只是绝对量级上的,还是结构性的:美国算力比中国大1-2个数量级,但最关键的差异在于,美国有相当一部分算力投入到了下一代的研究中,而中国今天还在解决任务交付爆发带来的算力瓶颈[1][18] - 但从历史经验看,“穷则生变”,作为“算力穷人”,中国团队更有紧迫感和动力去思考算法与基础设施的联合优化,这个出发点可以倒逼创新发生[18] - 面对光刻机的现实瓶颈,有可能在下一代的模型结构和芯片上从软硬结合的角度端到端地实现突破[18]
不追DAU的AI公司火了!MiniMax港交所上市,技术路线成关键
搜狐财经· 2026-01-13 18:39
公司上市与创始人背景 - MiniMax于2025年1月9日在港交所正式挂牌上市 [1] - 创始人闫俊杰将公司成功上市归因于坚持技术信仰且未中途放弃 [1] 战略转折与认知转变 - 2024年初公司核心目标是技术达到GPT-4水平、用户规模翻十倍并突破千万日活跃用户 [3] - 2025年春节前竞品DeepSeek-R1发布后,公司认识到大模型性能提升依赖算法迭代和算力投入,而非用户数据,因此放弃单纯追求日活跃用户的战略 [3] 核心技术路线与突破 - 公司自创立起即坚持研发混合专家系统技术路线,期间经历两次失败 [5] - 2025年1月发布的M1模型是国内首个线性注意力千亿参数大模型,能够轻松处理百万字文本 [5] 早期创业与资源分配 - 公司成立于2021年底,当时通用人工智能概念在国内不受投资人青睐 [7] - 早期将80%的算力资源投入混合专家系统研发,曾面临资源紧张,需通过其他方式补贴运营成本 [7] 产品演进与市场应用 - 产品路线从早期的3D数字人转向多模态交互,融合文本、图像和语音 [9] - 当前拥有三个核心产品:Glow主打情感陪伴,星野服务企业客户,海螺AI专攻长文本处理 [9] - 企业客户反馈显示,使用星野系统后质检效率提升40%,并降低了人力成本 [9] 技术优化与核心能力 - 公司在算力受限环境下采取“十倍优化”策略,用100张显卡完成同行需1000张显卡的实验 [11] - 长文本处理是核心技术优势,线性注意力机制使其能处理整本书内容,例如十分钟内从数百页案卷中整理出关键证据链 [11] 公司管理与行业挑战 - 公司采用三层架构的“函数优化式管理”,目标明确且参数透明 [15] - 行业挑战包括算力资源获取困难以及高端人才竞争激烈 [15] - 中国市场机遇在于用户对AI产品接受度高、应用场景丰富,例如海螺AI能根据学生错题本生成个性化讲义 [15] 未来趋势与公司愿景 - 多模态交互是未来趋势,交互方式将扩展至图片、旋律等 [17] - 公司愿景是“Intelligence with everyone”,让普通人也能使用顶级AI能力 [17] - 中国AGI创业公司的独特优势在于既能追赶技术前沿,又擅长本土化落地 [19]
人形机器人再迎政策催化!中控技术涨近10%,资金连续11日涌入机器人ETF基金(159213),合计净流入超3亿元!机器人4年后将完胜人类医生?
搜狐财经· 2026-01-13 17:43
市场表现与资金流向 - 1月13日A股市场震荡回调,沪指止步17连阳,机器人ETF基金(159213)当日收跌1.37% [1] - 尽管市场回调,资金持续涌入机器人板块,该ETF基金全天吸金超5500万元,并已连续11日强势吸金,累计超3亿元 [1] - 标的指数成分股当日涨跌不一,其中中控技术大涨9.9%,绿的谐波涨超3%,科大讯飞涨超2%,而大族激光跌超5%,机器人、汇川技术等跌超3%,大华股份、石头科技等回调 [2][4] 政策与行业动态 - 工信部表示,“十五五”时期将实施“人工智能+”行动,并聚焦人形机器人、脑机接口等领域,加强技术攻关、产品开发和生态建设 [3] - 在近期的CES展中,机器人获得重点关注,中国的人形机器人制造商占据主导地位,在38个人形机器人展位中,中国企业占据21个,比例超过一半 [5] - 资本市场方面,自变量机器人宣布完成10亿元A++轮融资,投资方包括字节跳动、红杉中国等,成为目前公开披露的唯一一家同时获得阿里、美团、字节投资的创业公司 [5] 技术发展与产业观点 - 东方证券观点认为,人形机器人简单的量产叙事边际影响将变弱,而具有通用人工智能(AGI)属性的叙事边际影响将变强 [7] - 根据Omdia报告,2025年FigureAI的人形机器人在全球市占率不到2%,但其估值在25年9月达390亿美元,远超排名靠前的中国公司,市值反差说明“大脑”的估值更高 [7] - 产业面临三大挑战:灵巧的手、理解现实世界的AI大脑、大规模量产能力,其中AI大脑是产业量产最关键、尚不成熟的挑战 [8] - 特斯拉采用多种方式推动大脑进化,并预计在26年2-3月准备好生产原型机,东方证券看好26年上半年左右的机器人量产投资机会 [9] - 国金证券指出,限制人形机器人大规模量产的重要因素是大脑进化,大模型是现阶段“大脑”的最佳解决方案,伴随着AI大模型迭代,机器人大脑有望实现跨越式发展 [9] 未来展望与市场预期 - 马斯克近期称,通用人工智能(AGI)在2026年就将到来,并预测3年内机器人在手术技能上将超越人类,4年后将达到“完胜任何人类医生”的水平 [6] - 从CES展看,英伟达CEO黄仁勋多次强调“物理AI”,预言“物理AI的ChatGPT时刻即将到来”,并表示“具备人类级别技能的机器人将在今年出现” [7] - 全球科技巨头与新秀全面下场布局人形机器人,行业量产奇点已至,市场存在万亿成长空间 [9]
【全网无错版】上周末,唐杰、杨强、林俊旸、姚顺雨真正说了什么?
机器人圈· 2026-01-13 17:41
文章核心观点 文章记录了2026年初中国AI领域一场汇聚顶尖学者与产业界核心人物的圆桌讨论,探讨了中国大模型行业的发展分化、AGI的下一个技术范式、Agent战略以及中国AI的未来前景[1][6]。核心观点认为,中国AI行业在经历了2025年开源模型的爆发式增长后,正进入一个关键的分化与战略选择期,行业需从追随转向引领,通过聚焦特定方向、探索新范式、发展Agent应用并改善创新环境,以在全球竞争中占据领先地位[6][22][57][70]。 话题1:中国大模型将如何分化? - **市场出现To C与To B的明显分化**:ChatGPT和Claude Code分别被视为To C和To B的典范。To C应用对智能强度的需求增长放缓,而To B应用则因智能直接关联生产力,对最强模型有明确的付费意愿溢价[8][9][10][11]。 - **技术路径出现垂直整合与模型应用分层分化**:在To C场景,模型与产品强耦合的垂直整合模式依然有效(如ChatGPT、豆包)。但在To B生产力场景,趋势是模型层与应用层分离,强大的基座模型被多样化的应用层产品所利用[12]。 - **企业战略分化基于自身基因与数据优势**:腾讯作为To C基因强的公司,其瓶颈在于为模型提供更多上下文(Context)和环境(Environment),而非单纯追求模型规模[13][14]。大公司可利用其内部多样化的真实场景数据来训练模型,这相比依赖外部数据标注商能获得独特优势[15]。 - **分化是自然演进与客户需求驱动的结果**:行业分化并非完全预设,而是在与客户频繁交流中自然发现机会(如Anthropic聚焦Coding和Finance),中国SaaS市场环境与美国不同也影响了分化路径[17][18]。 - **学术界与工业界的分化与协作**:工业界在资源投入上主导发展,学术界应跟进解决基础科学问题,如智能上界、资源分配效率、哥德尔不完备定理下的幻觉消除极限等[19][20]。 话题2:AGI的下一个范式 - **自主学习(Self-learning)成为硅谷共识与热点方向**:该方向已被广泛讨论,但其具体形态因场景和奖励函数不同而多样,例如聊天个性化、编码环境适应、科学探索等[23]。 - **自主学习已在特定场景下以渐变形式发生**:例如ChatGPT利用用户数据优化聊天风格,Claude Code项目95%的代码由自身编写以实现自我改进,这被视为一种特定场景下的AGI体现[24]。 - **新范式的瓶颈在于想象力与评估标准**:实现突破的关键条件可能已部分具备(如Cursor的模型利用实时用户数据更新),但更大的挑战是如何定义和验证“实现了自我学习”的成功标准[25][26]。 - **OpenAI仍被视为最有可能引领新范式的公司**,尽管其商业化可能削弱了部分创新基因[26]。 - **强化学习(RL)的潜力尚未充分释放**:RL的计算规模(Compute)尚未充分扩展,仍存在基础设施(Infra)问题,其潜力有待进一步挖掘[27]。 - **Task-time Scaling(任务时间缩放)与主动性(Active Learning)是关键探索方向**:让AI在单次任务中通过消耗更多计算时间(Token)变得更强,以及让AI能根据环境信号自主启动并规划任务,是重要的范式候选,但伴随安全担忧[27][28]。 - **个性化(Personalization)可能是自主学习早期落地的场景**,但如何衡量AI时代的个性化效果成为新的技术挑战[29][30]。 - **记忆(Memory)技术的突破可能是线性发展后的感知临界点**:技术本身线性发展,但当记忆能力达到某个临界点,用户体验可能发生跃迁,类似电影《Her》中的效果,这可能需要一年左右时间[31]。 - **联邦学习(Federated Learning)代表的协作范式前景广阔**:通过“多个中心协作”模式,能结合通用大模型与本地专业化模型,在医疗、金融等隐私要求高的领域具有应用潜力[34]。 - **2026年出现新范式变革的驱动力增强**:学术界算力资源提升使其具备创新基础;工业界持续投入的边际效率下降,催生对“智能效率”(Intelligence Efficiency)提升新范式的需求[35][36][37]。 话题3:Agent战略 - **To B的Agent已进入价值上升曲线**:Anthropic的路径表明,在To B领域,模型智能提升与解决任务数量、商业收入增长高度一致,使得生产力Agent的发展势头强劲[41]。 - **当前Agent发展的两大瓶颈是环境部署与用户教育**:即使模型能力停滞,通过更好部署到各行业也能带来巨大经济收益(潜在影响GDP 5%~10%,目前远低于1%)。同时,会使用AI工具的人与不会使用的人之间的能力差距正在拉大,教育至关重要[41][42]。 - **产品哲学趋向“模型即产品”(Model as a Product)或“研究即产品”(Research as a Product)**:成功的Agent产品(如Manus)以及OpenAI的模式显示,研究员端到端地将研究转化为产品是重要趋势[43]。 - **未来的Agent将是“托管式”且与自我进化、主动学习强相关**:能够执行长时间、通用任务的Agent,需要在任务过程中自我进化并主动决策,这对模型能力提出更高要求[44]。 - **Agent的终极潜力在于与复杂物理环境交互**:超越电脑环境,指挥机器人进行湿实验等操作,才能实现自动化人类更长时间工作流的愿景,这可能需3-5年并与具身智能结合[45][46]。 - **通用Agent的机会在于解决长尾需求**:与推荐系统类似,解决海量个性化、非标的长尾问题是AI和通用Agent的核心魅力与挑战所在[46][47]。 - **强化学习(RL)降低了修复模型问题的难度**:相比以前,现在只需少量查询(Query)和奖励(Reward)数据,就能通过RL快速优化模型在特定问题上的表现[48][49]。 - **Agent将经历从人工定义到内生自动化的四个阶段**:从当前目标与规划皆由人定义,最终发展为目标和规划均由大模型自主定义的内生(Native)系统[51][52]。 - **Agent成功的三要素是价值、成本与速度**:需解决有真实价值的问题、控制实现成本,并在快速迭代的时间窗口内建立优势[54][55]。 话题4:中国AI的未来 - **中国在技术追赶和工程复现方面具备强大能力**:一旦技术路径被证明可行,中国团队能快速跟进并在局部做到更好,制造业和电动车已有先例[57]。 - **突破新范式需要更多冒险精神与前沿探索**:中国拥有大量顶尖人才,但相较于美国,愿意从事高风险、探索性前沿研究的人可能还不够多,这受经济、商业环境和文化因素影响[58]。 - **研究文化更倾向于做确定性高和看重榜单排名**:国内研究更聚焦已被验证的路径(如预训练),对探索性方向(如长期记忆)相对谨慎。同时,相较于海外更注重实际体验(如Claude的实用性),国内有时对刷榜数字看得更重[60][61]。 - **算力资源分配存在差距,但可能催生“穷则思变”的创新**:美国在用于下一代研究的计算资源上领先中国1-2个数量级,中国大量算力用于产品交付。资源紧张可能反而激励算法与基础设施的联合优化等效率创新[62][63][64]。 - **年轻一代冒险精神增强与营商环境改善是积极信号**:90后、00后的冒险精神更强,结合中国营商环境的持续改善,为创新提供了可能[65][70]。 - **对中国团队3-5年内成为全球AI领导者的概率判断存在分歧**:林俊旸认为概率低于20%,主要因历史积淀和算力差距[66]。姚顺雨表示乐观,认为关键在于能否引领新范式[57][58]。杨强回顾互联网发展,认为中国在应用层面,尤其是To C领域,有望百花齐放并领先[66][68]。 - **成功的关键条件包括人才、环境与坚持**:需要敢于冒险的聪明人、更有利于创新的营商环境(减少交付压力、鼓励竞争),以及从业者在选定的道路上笨拙而持久的坚持[69][70][71]。
中金:受模型层情绪外溢 AI应用端迎来估值重塑
智通财经· 2026-01-13 16:29
文章核心观点 - AI大模型层近期催化不断,从AI基础设施、AI模型到AI应用均迎来估值抬升及新的投资机遇 [1] AI模型层 - 海内外基座模型加速更新,同时独立模型厂商上市形成双重催化 [2] - 国内模型方面,DeepSeek、字节豆包等有望在春节前后更新基座模型 [2] - DeepSeek开源模型V4计划于2月中旬发布,根据内部测试,其在代码能力方面已比肩Anthropic Claude [2] - 预计海外模型Anthropic、OpenAI、Gemini等也有望在第一至第二季度更新模型能力 [2] - 今年头部模型厂商仍会聚焦通过强化学习、长上下文工程优化等突破智能上限,收入端预计加速增长 [2] AI应用层 - 受模型层情绪外溢影响,应用端迎来估值重塑 [3] - 今年随着模型能力持续提高及垂类场景数据整合,AI应用渗透率将提升 [1][3] - 可重点关注业绩确定性高的AI Coding、用户付费意愿较强的AI健康、以及AI for Science中的AI医药等垂类赛道 [1][3] - 目前AI收入在应用公司总收入占比较低,市场可能对各公司AI业务给予分类加总估值,整体估值体系或将重塑 [3] AI基础设施层 - 长上下文与模型记忆能力的发展仍将拉动存储叙事延续 [4] - 长上下文是智能体实现多步长链任务的基础,导致键值缓存所需的内存量增加 [4] - 模型厂商正在探索如何优化模型记忆以实现持续学习和在线学习,例如将长期记忆写入模型参数,因此存储及数据库相关需求或仍将提升 [4] 相关投资标的 - 推荐AI应用相关厂商:金山办公(688111.SH)、鼎捷软件(300378.SZ)、福昕软件(688095.SH)、税友股份(603171.SH) [5] - 推荐AI基础设施相关厂商:深信服(300454.SZ) [5]
DeepSeek母公司去年进账50亿,够烧2380个R1
量子位· 2026-01-13 15:21
DeepSeek的独特发展模式与资金状况 - 自R1模型发布一年以来,DeepSeek未进行任何新融资,也未开展明显的商业化动作[1][2] - 公司持续产出高水平学术论文,研发团队保持高度稳定,新版R1论文作者甚至出现“回流”[3] - 公司是全球唯一一家未接受外部融资且不隶属于任何大型科技公司的AI实验室[35] 母公司幻方量化的财务支撑 - 母公司幻方量化在2025年业绩表现极为突出,旗下基金收益率普遍在55%以上[6] - 幻方量化管理的资产规模超过700亿元,其量化基金在2025年平均收益率达56.6%,在百亿级量化基金中排名第二[8][9] - 据彭博社报道,幻方量化在2025年可能为创始人梁文锋赚取超过7亿美元(约50亿元人民币)[10] - DeepSeek的研究经费直接来自幻方量化的研发预算,这笔巨额收入为其提供了充足的“弹药”[13] 极致的研发效率与成本控制 - DeepSeek的模型研发成本极低,V3模型研发仅花费557.6万美元,R1模型仅花费29.4万美元[15] - 按此成本计算,幻方量化2025年的收入足以支持训练125个V3模型或2380个R1模型[16] - 公司在持续改善训练效率,资金储备充足[16] 与行业主流商业化路径的对比 - 行业其他主要玩家如OpenAI正积极寻求商业化,包括探索广告、以算力换取芯片厂商投资(据称从英伟达等公司获得超1万亿美元支持)以及推动多种产品矩阵[18][20][21][22] - 相比之下,DeepSeek专注于AGI研究,即使发布如R1这样的强大模型也选择开源,并未急于产品化或商业化[25][26] - 公司将资源主要集中于底层模型训练,而非高并发的应用场景推理[29] 独特的公司结构与战略优势 - DeepSeek的资金完全依赖母公司输血,而幻方量化已停止接受外部资金,这使得DeepSeek不受外部股权结构或短期盈利预期的约束[38][39] - 公司最初是作为辅助量化投资的“副业”启动,与母公司业务相辅相成,没有内部转型阻力[40] - 这种模式集成了成熟商业模式(如谷歌的搜索广告)的现金流优势与AI原生公司(如OpenAI)的专注度优势[43][49] 稳定的团队与科研文化 - 由于无需为资金发愁,DeepSeek能维持纯粹的科研环境,让团队全身心投入AGI研究[51] - R1论文发布近一年后,18位核心贡献者全部仍在团队,总计100多位作者中仅有5位离开,团队稳定性极高[52][53] - 与去年相比,作者名单中离开标记减少一个,出现人才“回流”现象[54][55] - 公司能为研究员提供顶级资源和丰厚薪酬,吸引并留住有志于AGI研究的人才[57] 对相关产业的溢出效应 - DeepSeek发布的技术报告和硬件设计建议被部分投资者视为“研报”,用于指导投资决策[61] - 国产芯片公司会迅速针对DeepSeek的新模型进行适配,相关消息常引发股价波动,例如寒武纪在V3.2发布四分钟后宣布完成适配,次日股价跳涨近5%[65][67][70]
从商汤叛将到AI新贵,闫俊杰的“反套路”公司要上市了
搜狐财经· 2026-01-13 13:57
公司概况与市场定位 - 公司是AI行业中一个独特的样本,其业务模式介于科技公司与游戏公司之间,七成收入依靠“虚拟恋人”业务,同时将AGI(通用人工智能)作为发展目标 [3] - 公司已向港交所递交招股书,其市场动向引发行业广泛关注 [3] 团队管理与运营效率 - 公司创始人闫俊杰拥有商汤科技背景,其创业理念旨在解决传统AI公司效率低下的问题,进行“反商汤”实验 [5] - 公司团队极为精简,总人数仅385人,平均年龄29岁,管理层平均年龄约32岁 [7] - 公司组织结构扁平,CEO以下最多只有三层职级,确保了高效的信息传递 [7] - 运营高度依赖AI协同,公司80%的编程代码由AI自动生成,实现了“小团队+AI”的高效工作模式 [9][10] 财务状况与资本策略 - 公司累计研发投入仅为5亿美元,与行业巨头数百亿美元的投入相比规模很小 [12] - 公司现金储备充裕,达到11亿多美元,并且主要通过理财积累 [12] - 公司采用“轻资产、重模型”的资本策略,在烧钱的AI行业中独树一帜 [14] 收入结构与商业模式 - C端业务(Talkie平台,以虚拟恋人、角色扮演和抽卡机制为主)是公司主要的现金来源,贡献了71%的营收 [17] - 过于依赖C端“二次元”或“荷尔蒙经济”业务,导致资本市场可能将其视为游戏公司,从而影响其估值 [18] - B端业务增长迅猛,收入占比已接近30%,同比增长高达161% [22] - B端采用标准化API服务模式,拒绝定制化私有部署,已覆盖13万企业客户 [22] - 公司商业模式的核心是利用C端业务(如Talkie)产生的现金流和用户交互数据,来反哺和加速B端AGI技术的研发与模型迭代 [20][26] 技术实力与产品 - 公司的M2模型在ArtificialAnalysis榜单上位列全球前五,在开源领域排名第一 [24] - 公司具备全模态能力,提供涵盖文本、语音、视频、音乐的完整解决方案 [24] 市场拓展与全球化 - 公司收入高度依赖海外市场,70%的收入来自海外 [27] - 公司已成功将其服务嵌入全球主要云基础设施,包括亚马逊、谷歌和微软的云平台 [27] - 公司的全球化路径与智谱AI等“学院派”不同,其定位是成为融入生活与工作的“超级伙伴”,而非“超级大脑” [29] 行业启示与发展挑战 - 公司的实践表明,AI创业并非只有烧钱一条路,效率革命和路径创新同样重要 [31] - 公司模式为中国AI行业提供了平衡理想(AGI)与现实(商业化)的样本 [33] - 公司面临的挑战包括:“荷尔蒙经济”的可持续性、当前53个月现金储备能否支撑长期研发、以及技术指标与商业变现的长期协同问题 [31]
腾讯研究院AI速递 20260113
腾讯研究院· 2026-01-13 00:37
谷歌推出通用商业协议UCP - 谷歌联合Shopify、沃尔玛等超过20家零售巨头推出通用商业协议,为AI智能体购物建立统一开放标准,覆盖从商品发现到售后的全流程 [1] - 该协议已在谷歌搜索AI模式和Gemini应用中实现“智能体结账”功能,支持Google Pay并即将接入PayPal,零售商在交易中保持主体身份 [1] - 谷歌将UCP完全开源,兼容智能体支付协议、A2A协议和MCP等多种协议,旨在降低生态参与门槛,让中小商家也能享受AI购物红利 [1] Midjourney更新Niji v7动漫模型 - Midjourney联合Spellbrush推出Niji v7动漫专属模型,修正了v6版本偏写实的倾向,回归纯动漫感,在眼神细节、动态肢体和材质质感上全面提升 [2] - 新增sref风格参考功能,支持上传3张参考图以保持统一画风,模型理解能力大幅提升,能准确识别“四只手每只拿冰淇淋”等复杂提示词 [2] - 实测显示,v7版本在光影细节、复杂姿势稳定性和纯动漫线条质感上全面超越v6,特别适合分镜生成和系列化创作 [2] BabyVision评测揭示VLM视觉短板 - UniPat AI联合红杉中国xbench等机构发布BabyVision评测基准,将视觉能力拆分为精细辨别、视觉追踪、空间感知、视觉模式识别四大类共22个子任务 [3] - 评测结果显示,Gemini-3-Pro-Preview是唯一超过3岁儿童基线的模型,但距离6岁儿童水平仍差20个百分点,在“连线找垃圾桶”等简单任务上模型集体表现不佳 [3] - 研究揭示视觉语言模型的最大短板是无法将视觉信息完整语言化,这些“unspeakable”视觉题在压缩成token时细节丢失,导致模型难以完成追线、数积木等任务 [3] 昆仑万维推出Skywork Video v1.0 - 昆仑万维在天工超级智能体上推出Skywork Video v1.0,采用“项目制”整合创作流程,所有素材自动归集并可一键添加至多轨道编辑器 [4] - 提供文本生成、图片动效、首尾帧补全、多图风格参考生成及数字人视频生成五种启动方式,内置多轨道编辑器支持分割、替换等精细操作 [4] - Skywork产品矩阵已完成从文档、表格、演示文稿到视频生成的全模态覆盖,构建了一个覆盖多场景、支持多模态的智能办公平台 [4] 逐际动力发布具身Agentic OS - 逐际动力发布全球首个具身Agentic OS——COSA系统,采用三层架构实现大小脑一体化融合 [5][6] - COSA赋予机器人理解模糊指令、跨时间语义记忆和“想到就能做到”三大核心能力,其机器人Oli实现了“移动-操作-移动”一镜到底的操作 [6] - 与Figure AI的Helix端到端VLA模型不同,COSA从架构底层构建面向物理世界的操作系统,在移动操作融合能力上展现出明显优势 [6] 千寻智能开源VLA模型Spirit v1.5 - 千寻智能开源视觉语言动作基础模型Spirit v1.5,在RoboChallenge的Table30榜单上位列第一,超越了Pi0.5,并获得英伟达Jim Fan的点赞 [7] - Spirit v1.5的核心突破在于采用“开放式、目标驱动”的数据采集策略,摒弃“干净数据”转向内化物理常识,其多样化数据使微调收敛速度提升了40% [7] - 非结构化的采集方式使人均有效采集时长增加了200%,对算法专家的依赖降低了60%,公司开源了模型权重和推理代码供社区复现探索 [7] Anthropic联创对AI开发效率的观察 - Anthropic联合创始人Jack Clark透露内部调查存在矛盾数据:60%的Claude使用者自报生产力提升了50%,但METR研究显示,熟悉代码库的开发者使用AI工具后,PR合并速度反而下降了20% [8] - Clark指出代码生产存在“木桶原理”,即写代码速度可能快10倍但审查速度只提升2倍,因此整体效率不会爆炸式增长,并强调截至2026年1月地球上还不存在真正递归自我改进的AI [8] - 他强调如果Scaling Law真的撞墙将是最令人震惊的事,当前巨额的基础设施投资表明大多数人押注相反结果,分布式预训练若取得突破将改变AI的政治经济结构 [8] Linux之父使用AI工具开发项目 - Linux之父Linus Torvalds在GitHub发布了首个Vibe Coding项目AudioNoise,该项目使用谷歌Antigravity生成Python可视化工具,他坦言效果“比自己写的好” [9] - 该项目灵感源自吉他效果器板设计,主要探索数字音频处理基础知识,包含IIR滤波器和延迟循环等零延迟单采样处理 [9] - 仅在5天前的1月7日,Torvalds还在内核开发讨论中批评AI生成垃圾代码“愚蠢至极”,此次开源使用AI工具引发了圈内的“真香时刻”热议 [9] 马斯克关于AI与未来的预测 - 马斯克预测人工智能将在2026年达到AGI,2030年AI智能将超越全人类智能总和,AI性能每年以10倍速度提升,其xAI的孟菲斯Colossus 2数据中心将在1月中旬达到1吉瓦功率 [10] - 他提出AI安全的三个关键词,预测三年后Optimus机器人的手术水平将超越顶级外科医生,五年内机器人将从稀缺变为充裕,到2040年将达到100亿台 [11] - 马斯克强调“太阳是一切”的能源观点,赞赏中国太阳能年产能达到1500吉瓦,预测未来货币的本质是瓦特,并认为白领工作将最先被AI替代,但最终将实现全民富足 [11]
上市即亏损53亿!智谱CEO揭秘,我们的对手不是大厂是AGI本身
搜狐财经· 2026-01-12 21:50
公司上市与市场表现 - 智谱于1月8日在港交所挂牌上市,股票代码为“09900”,被称为“全球大模型第一股” [1] - 公司开盘价为124.1港元,较发行价上涨6.88% [3] 公司背景与融资历程 - 公司成立于2019年,脱胎于清华大学知识工程实验室 [3] - 成立初期即获得君联资本和启明创投的天使轮投资,后续融资方包括高瓴、美团、腾讯等巨头,累计融资额达83亿人民币 [5] 财务表现 - 2024年公司亏损29.58亿人民币,2025年上半年亏损23.58亿人民币,自成立以来累计亏损超过53亿人民币 [5] - 收入呈现高速增长,2022年至2024年收入复合增长率为130%,2025年上半年收入为1.91亿人民币,同比增长325% [7] 团队结构与治理 - 公司采用唐杰、张鹏、刘德兵三人的“集体决策”模式,区别于个人主导的创业公司 [9] - 唐杰为首席科学家,原清华大学教授,领导开发了GLM大模型框架;张鹏负责商业化;刘德兵负责技术落地 [9] 商业模式与战略 - 公司未参与C端应用投流大战,而是专注于B端市场,2025年上半年本地部署收入占比达84.8% [11] - 公司采取B端和MaaS(模型即服务)服务两条腿走路的差异化竞争策略 [16] - 上市募资43亿港元,其中70%将投入通用AI大模型的研发 [18] 技术与产品 - GLM大模型框架已迭代至4.7版本,具备文本、图像、代码生成等多模态能力 [9] - 计划于下月发布GLM-5模型,据称将采用全新架构并具备自我持续学习进化能力 [18] 行业竞争格局 - 大模型行业经历洗牌,大厂之外知名的创业公司仅剩智谱、月之暗面、MiniMax等少数几家 [16] - 竞争对手路径各异:月之暗面专攻科研领域,MiniMax全力投入消费级AI,智谱则聚焦B端和MaaS [16] 未来展望与战略规划 - 首席科学家唐杰预测“2026年将是AI替代不同工种的爆发年”,其办公室贴有“2026 AGI落地”的倒计时日历 [11][14] - 公司计划开拓海外市场,主攻“一带一路”和东南亚国家,并倡议建立自主大模型国际共建联盟,以避开欧美市场的专利壁垒 [18][20] 行业面临的挑战 - 行业普遍面临算力资源“卡脖子”问题,例如A100芯片供应紧张 [21] - 人才成本高昂,资深算法工程师年薪可达200万人民币 [21] - 企业级市场商业化挑战大,客户要求定制化开发且交付周期长 [23]
马斯克 3 小时高能量访谈,全是暴论
程序员的那些事· 2026-01-12 20:32
人工智能发展预测 - 公司预测通用人工智能将于2026年实现,到2030年人工智能将超越全人类智能的总和 [7][8] - 公司认为人工智能在智能密度上还有两个数量级(100倍)的提升空间,并预测AI性能每年将有10倍的提升 [8][9] - 公司预计明年会让人感觉像是活在未来,比以往任何一年都更像未来 [10] 算力基础设施进展 - 公司正在孟菲斯建设Colossus 2数据中心,预计1月中旬将建成全球首个功率达1吉瓦的AI训练集群,到4月左右将扩展到1.5吉瓦 [11] - 公司旗下Grok 4在人类最后考试测试中已获得52%的分数,即将推出的Grok 5可能接近满分 [11] 人工智能安全与教育 - 公司提出确保AI安全的三个核心特质是:真相、好奇心和对美的感知 [12][15] - 公司认为真相可以防止AI因矛盾指令而“发疯”,好奇心可保护人类的存在价值,对美的感知能让AI创造美好未来 [12][13][14][15] - 公司正与萨尔瓦多合作推出全球首个全国性AI教育项目,认为AI可以成为无限耐心的个人教师 [16][17] 人形机器人发展 - 公司预测其Optimus机器人将在三年后达到超越最佳外科医生的手术水平,并能大规模部署 [18][19] - 公司认为五年后,机器人外科医生与人类外科医生的差距将大到没有可比性 [19] - 公司解释人形机器人进步迅速源于AI软件、AI芯片和机电灵活性的三重指数增长叠加,以及制造递归和网络效应 [20] - 公司曾预测2040年人形机器人数量达100亿台,但认为这是保守数字,真正的瓶颈是金属和供应链,预计两年内机器人会大量出现,五年内从稀缺变为充裕 [20] 能源与未来基础设施 - 公司强调太阳是能源问题的终极答案,指出人类目前仅利用了地球接收太阳能的约1%,而合理文明目标应是获取其百万分之一到千分之一 [23][24] - 公司赞赏中国在太阳能领域的领先地位,指出中国年产能约1500吉瓦,去年新增500太瓦时装机量中70%来自太阳能,并预测到2026年中国电力产出将达到美国的三倍 [26] - 公司认为在地球上搞核聚变是荒谬的,并预测未来的货币本质将是瓦特(能量) [25][27] - 公司对太空数据中心感到兴奋,认为一旦星舰完全可重复使用,每次发射边际成本可能仅约100万美元,并展望未来在月球制造卫星并用质量投射器发射的可能性 [27][28][29] 人工智能对社会经济的影响 - 公司预测未来将同时出现全民高收入和社会动荡,白领工作会最先被AI取代,目前AI水平已可替代一半以上白领工作 [32][33] - 公司认为变革将缓慢发生,但最终完全AI化的公司将摧毁非AI化的公司 [34][36] - 公司提出可能的解决方案是“全民高物品和服务”,由于商品和服务产出增速超过货币供应,将导致价格暴跌和通缩 [37][38]