Workflow
AGI
icon
搜索文档
智谱回应通过港交所上市聆讯:不予置评
新浪财经· 2025-12-17 20:42
有消息称,AI大模型企业智谱已于今日通过港交所上市聆讯,有望成为"全球大模型第一股"。这标志着 港股将首次迎来一家以AGI基座模型为核心业务的上市公司。 12月17日,智谱对智通财经记者回应称:不予置评。(智通财经记者 范佳来) ...
智谱通过港交所上市聆讯 官方暂未回应
第一财经· 2025-12-17 20:31
(文章来源:第一财经) 12月17日,第一财经了解到,大模型初创公司智谱已通过港交所上市聆讯,港股也将迎来以AGI基座模 型为核心业务的上市公司。截至发稿,智谱官方暂未回应。 ...
腾讯大模型,变阵
36氪· 2025-12-17 20:29
腾讯AI战略与组织架构调整 - 腾讯从OpenAI挖来核心研究员Vinces Yao(姚顺雨)出任首席AI科学家,打破内部提拔传统[1] - Vinces Yao向总裁刘炽平直接汇报,而非向技术工程事业群负责人汇报,表明大模型已升级为公司级一号工程[4] - 公司成立由Vinces Yao亲自带队的AI Infra(基础架构)部和刘煜宏负责的AI Data(数据)部,将基础设施与数据管理独立建制[7] - 此次调整旨在结束内部“小作坊”和“赛马”模式,将分散的AI研发力量聚合成“集团军”,从“实验室模式”转向“大工厂模式”[6][11][16] 战略路线与行业竞争 - 挖角Vinces Yao并让其同时掌管AI基建和大语言模型部,释放出腾讯将走纯正OpenAI路线、信奉Scaling Law(规模法则)的强烈信号[5] - 公司战略从试图以应用层倒逼模型层,转向承认必须从地基开始重建,追求通用人工智能[5][6] - 在AI应用层竞争上,腾讯意识到在“快”上跑不过字节跳动的“APP工厂”模式,因此转向赌“厚”,致力于打造更厚的通用智能底座和微信搜索入口[13][15][16] - 行业对决体现为两种顶层设计:字节跳动(DeepMind背景)的“特种部队”模式赌应用与流量;腾讯(OpenAI背景)的“集团军”模式赌底座与智能深度[14][17] 人才争夺与资源投入 - 为抢夺人才,腾讯开出极其激进的薪资,普遍上浮50%为基准线,对顶级人才甚至直接开出2倍薪资[18] - 公司抢夺目标包括字节跳动、阿里巴巴以及“AI六小虎”(如Kimi、MiniMax、零一万物等)的核心员工[18] - 此举被视为大厂对创业公司的“降维打击”,利用“资金 + 算力 + 场景 + 高薪”的组合优势摘取创业公司培养的人才果实[19] 产品与市场终局 - 调整明确将构建AI搜索能力的职责划归Vinces Yao负责的大语言模型部,目标是将AI能力无缝接入微信“搜一搜”[20][21] - 公司终极目标是打造一个日活10亿级的超级AI入口,而非仅仅是一个日活几千万的聊天机器人[22] - 腾讯认为ChatBot可能是过渡形态,Search才是AI最大的落地场景,计划在未来的“AI搜索”战场上打一场翻身仗[23] - 公司拥有微信搜索这一所有对手都羡慕的独特入口,结合OpenAI级别的模型能力与高质量数据,可能形成强大竞争力[21] 技术发展重点 - 公司认识到当模型参数达万亿级别时,卡间通信与训练框架效率成为关键,因此需将算法与算力打通,极致压榨硬件性能[8][9] - 随着互联网高质量文本数据枯竭,Scaling Law面临失效,突破的关键在于获取更纯净、高质量的数据及生成合成数据[9] - 独立数据部门旨在将微信、公众号、QQ中的“数据金矿”以工业化方式清洗利用,为模型训练提供顶级“食材”[9][10]
何小鹏:当前没有AI泡沫!物理AI或将在未来三年迎关键突破
证券时报网· 2025-12-17 18:41
文章核心观点 - 小鹏汽车董事长何小鹏分享了其对中美AI产业生态、物理AI发展前景以及AGI(通用人工智能)的最新研判,并基于此将公司定位升级为“物理AI世界的出行探索者,面向全球的具身智能公司”,旨在推动公司价值重构 [1][2][3] 中美AI与机器人产业生态对比 - 美国在AI、生物、金融领域的创业较多,硅谷在SaaS和物理AI机器人领域的创业尤其集中且估值特别高,何小鹏此次会面近三十位AI领域朋友中约一半是机器人创业者 [1] - 中国机器人公司多从关节和控制技术入手,而美国机器人公司多从模型入手 [1] - 人形机器人领域未来将是巨头间的竞争,而不同的专用机器人领域将存在大量成功机会 [1] - 整体上,中国AI估值比较合理,美国估值实在有一点高;中国更关注市场应用,美国更关注前沿研究 [2] 对“物理AI”的理解与公司战略 - 何小鹏提出“物理AI”概念,认为未来3年重大突破更可能发生在物理AI领域,而非数字世界 [2] - 物理AI的发展速度可能比数字AI慢,但改变生活的力度会更大 [2] - 在物理AI领域,自动驾驶有望直接到达准L4或完整L4级别;人形机器人可能实现从类似自动驾驶L1到L4初阶的快速跨越 [2] - 小鹏汽车在科技日围绕“物理AI”发布了四项重要应用:小鹏第二代VLA、小鹏Robotaxi、全新一代IRON以及汇天两套飞行体系,并已有明确的量产计划,强调“物理AI”是触手可及的现实 [1] - 公司正式升级企业定位,从“未来出行探索者”转型为“物理AI世界的出行探索者,面向全球的具身智能公司” [3] 对AI发展阶段的研判 - 当前AI发展仍处于0到0.1的最开始阶段,整体认为当前没有AI泡沫,未来AI市场存在巨大机遇 [2] - 任何科技时代(如互联网、新能源汽车)都存在阶段或局部泡沫,这是市场从混沌到有序的必然竞争过程 [2] - 今天的AI主要是模仿学习和强化学习,虽能快速学习并涌现新能力,但并非真正的创造力 [3] - 真正的AGI(通用人工智能)还需要多模态到世界模型、持续学习、长时序洞见和规划等能力,可能还需要数年时间及底层能力的再次提高 [3]
“雷军的AI秘密武器”罗福莉首秀:详解小米AGI之路
创业邦· 2025-12-17 18:19
公司AI战略与模型发布 - 小米于2025年12月17日举办“人车家全生态合作伙伴大会”,前DeepSeek核心成员罗福莉首次公开演讲,标志着公司AI研发走向“正规军化”和“极客化”[6] - 公司发布了面向智能体的新一代基座模型MiMo-V2-Flash,并已开源所有模型权重、技术报告,并提供API和体验Web[40] - 罗福莉阐述了公司的AGI愿景,认为真正的智能需从交互中产生,最终目标是打造一个能推演世界运作逻辑、具备物理一致性的虚拟宇宙,而不仅仅是语言程序[6][42] 模型MiMo-V2-Flash核心特点 - 模型采用MoE架构,总参数达3090亿,但激活参数仅为150亿,通过MTP技术实现高效推理,生成速度达150 tokens/秒,带来约2.5倍加速[7][32] - 模型采用创新的Hybrid SWA注意力机制,锁定128 tokens的“神奇窗口”,支持256K长上下文,并固定KV缓存以降低硬件压力,在代码生成上刷新了SOTA[10] - 在落地层面追求高性价比,后训练阶段采用MOPD技术,用极低计算量(不到标准流程1/50)复刻教师模型性能,旨在降低大规模部署成本[10] 模型性能与成本优势 - 在代码能力和智能体能力上,该模型在全球开源模型评估榜单中进入Top 1-2行列,大部分评估基准超过或与总参数量为其2-3倍的DeepSeek-V3、Kimi、Qwen等模型相当[24] - 在价格与速度的权衡中,该模型定位为低成本、高速度,其推理速度比DeepSeek-V3.2快约3倍,而推理成本比综合性能相当的Gemini 2.5 Pro便宜20倍[27] 技术创新细节 - 模型架构围绕“极致推理效率”设计,采用Hybrid Attention结构,其中Sliding Window Attention与Full Attention的比例约为5:1,以兼顾性能并适配主流推理框架[29] - 深度挖掘MTP技术潜力,在训练和微调中加入MTP层以提升基座潜能,最终推理时使用三层MTP进行加速并行Token验证,实现2.2到2.6倍的推理加速[31][32] - 提出MOPD训练范式,利用稠密的令牌级奖励进行监督学习,可高效将各领域专家能力蒸馏到学生模型上,并尝试通过学生模型自我迭代实现持续提升[34][36] 对AI发展路径的思考 - 从生物进化视角看,智能发展遵循从控制身体与环境互动、到强化学习、再到大脑模拟未来、最后掌握语言的路径,而当前大模型的发展是“倒叙”,先掌握了语言[16][19] - 大模型通过海量文本的下一词预测学习,本质上是压缩了人类数十亿年对世界的认知同构,解码了人类思维在文本空间的投影,这是一种自顶向下的捷径[19] - 公司认为AI进化的下一个起点是构建物理模型,让智能体具备从“回答问题”到“完成任务”的能力,这需要统一的全模态感知能力和对物理规律的理解[40][42] 现状与挑战 - 尽管模型追求高效推理,但其150亿的激活参数对当前旗舰手机等移动设备而言依然过高,端侧AI的舒适区仍停留在30亿到70亿参数之间[11] - 模型当前的“高效推理”更多指在云端数据中心实现高吞吐量,对用户终端而言仍是一个重度依赖网络的“云端模型”,并未打破端侧AI的算力天花板[11] - 公司旨在通过高效推理与智能体技术,推动AI从“语言交互”跨越到“物理世界”以赋能“人车家全生态”,但这一理想仍在路上,现有硬件尚难完全支撑[9]
何小鹏:当前没有AI泡沫!
证券时报· 2025-12-17 18:00
文章核心观点 - 小鹏汽车董事长何小鹏基于其在美国与AI领域人士的交流,分享了对中美AI竞争、产业生态及“物理AI”发展趋势的最新研判,并阐述了小鹏汽车向“物理AI世界的出行探索者”和“全球具身智能公司”转型的战略定位 [1][4] 对中美AI及机器人产业的观察 - 美国在AI、生物、金融领域的创业活动众多,尤其在硅谷,SaaS和物理AI机器人领域的创业公司非常集中且估值特别高 [1] - 中美机器人公司的发展路径存在差异:中国公司多从关节和控制入手,而美国公司多从模型入手 [1] - 人形机器人领域未来将是巨头的竞争,而不同的专用机器人领域则会有大量不同领域的选手,并存在非常多的成功机会 [1] - 当前AI领域的估值,中国比较合理,而美国估值实在有一点高;中国更关注市场应用,美国更关注前沿研究 [2][3] 对“物理AI”的理解与展望 - “物理AI”被认为是未来可能产生大变局的领域,其发展速度可能比数字AI慢,但改变生活的力度会更大 [2] - 未来3年,重大突破可能发生在物理AI领域,例如自动驾驶直接到达准L4或完整L4,人形机器人实现从L1到L4初阶的快速跨越 [2] - 当前AI主要是模仿学习和强化学习,尚不具备真正的创造力,真正的AGI(通用人工智能)还需要多模态到世界模型、持续学习、长时序洞见和规划等能力的进一步发展,可能还需数年时间 [3] 小鹏汽车的“物理AI”战略与产品规划 - 小鹏汽车在2025科技日上强调了“物理AI”概念,并围绕此发布了四项重要应用:小鹏第二代VLA、小鹏Robotaxi、全新一代IRON以及汇天两套飞行体系 [1] - 这些AI应用已有明确的量产计划,表明“物理AI”并非遥不可及,而是人人触手可及的现实 [1] - 小鹏汽车已正式升级企业定位,从“未来出行探索者”转向“物理AI世界的出行探索者,面向全球的具身智能公司” [4] - 市场正跳出造车的眼光,以物理AI的视角重新打量小鹏,其价值可能被重构为一家面向全球的、以AI驱动物理世界智能化的科技企业 [4] 对AI泡沫与行业发展阶段的看法 - 任何科技时代(如互联网、新能源汽车)都可能有阶段或局部的泡沫,这是市场从混沌到有序的必然竞争过程 [2] - 整体认为当前没有AI泡沫,未来AI市场存在巨大机遇,目前AI发展仍处于0到0.1的最开始阶段 [2][3]
罗福莉首秀小米:MiMo大模型开源破局,AI战略锚定 “物理
搜狐财经· 2025-12-17 17:21
小米AI战略与认知框架 - 公司AI战略由原DeepSeek核心成员、MiMo大模型负责人罗福莉首次公开阐述,其核心观点认为AI正以非线性方式重演人类大脑6亿年的进化史[3] - 公司认为语言是“人类思维和物理世界在符号空间的投影”,因此选择从语言切入构建Agent语言基座模型MiMo-V2-Flash[3] - 公司对AI“护城河”的定义是科学的研究文化与方法,以及将未知问题结合模型优化转化为可用产品的能力,而非算力和数据[4] - 公司明确其AI发展路径与OpenAI联合创始人Ilya“语言可实现终极AGI”的观点存在差异,强调需让大模型跳出文本局限,通过多模态感知理解物理世界[4] MiMo-V2-Flash模型技术细节 - 发布的MiMo-V2-Flash模型在全球开源模型代码与Agent测评基准中跻身TOP2[3] - 模型关键突破在于“极致推理效率”:采用Hybrid SWA架构固定KV Cache以强化长文推理能力,并通过3层MTP推理加速并行Token验证,将推理速度提升2-2.6倍[3] - 模型在同类性能模型中实现了“低成本+高速度”的双重优势,现场演示展现了通过HTML编写简易操作系统、模拟太阳系运行轨迹的能力[3] - 公司宣布MiMo-V2-Flash发布即开源,模型权重、技术报告全面开放,API限时免费[6] 公司业务与研发投入支撑 - 2025年前三季度,公司实现收入超3400亿元,同比增长32.5%,经调整利润增长73.5%[4] - 2025年1-10月,公司在中国手机市场销量稳居第二[4] - 未来五年,公司研发投入预计超2000亿元,其中2026年单年投入将达400亿元左右[5] - 研发投入将聚焦“芯片、OS、AI”三大核心技术,作为“人车家全生态”的底层支柱[5] “人车家全生态”战略构成 - 生态产品端覆盖个人设备(手机、PC等)、出行设备(汽车)、家庭设备(IoT)[5] - 生态技术端以芯片、OS、AI为核心驱动力[5] - 生态制造端依托手机、汽车、大家电工厂实现落地[5] - 该全链路覆盖的生态为MiMo大模型提供了从手机端侧推理、汽车智能交互到家庭IoT设备联动的真实场景土壤[5] 开源战略与行业影响 - 公司认为开源的价值是“一种分布式的技术加速主义”,并指出早年开源模型与顶尖模型存在三年代差,如今差距已缩短至“数月”[6] - 公司视开源为实现AGI普惠化、确保所有人类智慧共同进化的唯一路径,是其对AGI发展的“伦理立场”,旨在避免技术被少数主体垄断[6] - MiMo-V2-Flash作为性能TOP2的开源模型,可能推动行业格局变化,使中小开发者无需巨额基础模型研发成本,可聚焦场景化创新[6] 团队与执行能力 - 公司大模型Core团队是“研究、产品与工程深度耦合的年轻团队”,具备“小而美”的创业精神与技术转化能力[4] - 从罗福莉11月12日官宣加入,到12月16日模型发布,再到17日公开演讲,短短一个月团队快速落地,印证了其执行优势[8]
罗福莉执掌小米大模型首秀!定调下一代模型,全新MiMo-V2开源还横扫Agent第一梯队
AI前线· 2025-12-17 16:00
小米大模型战略与MiMo-V2-Flash发布 - 小米在2025年合作伙伴大会上,由新任命的大模型负责人罗福莉首次公开亮相,并发布了新一代开源大模型MiMo-V2-Flash [2][3][4] - 该模型采用MoE(混合专家)架构,总参数规模达3090亿,但每次推理仅激活约150亿参数,旨在实现高速、高频、低成本的推理 [8] - 模型设计目标明确为“要跑得快、跑得久、被高频调用也跑得起”,核心是为Agent(智能体)和真实世界应用场景服务 [8][16] 技术负责人背景 - 大模型负责人罗福莉是行业知名AI技术专家,硕士毕业于北大,曾任职于阿里巴巴达摩院和DeepSeek母公司幻方量化,参与研发DeepSeek-V2等模型 [11][12] - 她于2024年11月加入小米,此次演讲是其入职后的首次公开亮相 [13] 模型设计理念与工程逻辑 - 公司认为当前大语言模型本质上是解码了人类思维在文本空间中的投影,而非真正理解物理世界,因此语言是工具而非终点 [19][20][35] - MiMo-V2-Flash的设计目标不是追求“更聪明”,而是“更好用、更可部署”,其技术选择是被Agent场景需求“倒逼”出来的工程取舍 [21][22] - 模型研发主要围绕三大现实挑战展开:智能体需要高效的代码与工具调用沟通语言、智能体间交互带宽低要求极高推理效率、大模型范式正从预训练转向后训练和强化学习 [25][41] 核心技术特点与性能 - 模型采用Hybrid Attention混合注意力结构(Sliding Window Attention与Full Attention比例约5:1),以兼顾长短文本推理并适配现有推理基础设施 [45] - 深入挖掘多词元预测技术潜力,在预训练和微调阶段引入MTP层以提升模型潜能,在推理阶段使用三层MTP并行,实现约2到2.6倍的推理加速 [24][46][47] - 在单机环境下,模型输出吞吐可达5000到15000 token/s,单请求输出速度达150 token/s,相比不使用MTP速度提升约2-3倍 [24][47] - 在后训练阶段,公司提出了Multi-Teacher On-Policy Distillation范式,以高效、稳定地将多个专家模型能力蒸馏到学生模型中 [47][50] 模型性能对比与评测结果 - 在7项主流评测中,MiMo-V2-Flash在Agent、代码、工具调用和复杂任务执行方面已进入全球开源模型第一梯队,整体表现与DeepSeek-V3.2、Kimi-K2-Thinking基本相当 [27][40] - 在SWE-Bench基准测试中,MiMo-V2-Flash在多语言模式下以71.7%的准确率获得一项第一 [28] - 在推理效率对比上,MiMo-V2-Flash的推理成本略低于DeepSeek-V3.2,但推理速度约为后者的三倍;与综合能力相近的Gemini 2.5 Pro相比,推理速度接近,但成本低约20倍 [40][48] 对AGI发展的观点与未来方向 - 公司认为当前大模型虽能完成复杂任务,但缺乏对物理一致性、时空连续性及因果关系的理解,这是“具身幻觉”的根源 [30][52] - 真正的下一代智能体需从“回答问题”转向“完成任务”,并具备与世界交互的能力,其核心是构建一个统一、动态的世界模型,而非仅增加多模态输入 [31][32][52][53] - 智能不是从文本中“读出来”,而是要在与真实环境的持续交互中“活出来”,AI进化的下一个关键点是发展能够持续交互的物理模型 [33][52] - 公司对开源持积极态度,视其为一种分布式的技术加速机制,是缩短开源与闭源差距、推动AGI普惠化的现实路径 [33] 模型发布与生态 - MiMo-V2-Flash已正式发布并开源,同步开放了模型权重、技术报告和API,方便开发者接入Web Coding、IDE等场景,体验网页也已上线 [50]
95后“AI天才”罗福莉首秀:中国模型距顶尖差距从三年缩至数月!她出身农村普通家庭,曾被雷军千万元年薪挖角
每日经济新闻· 2025-12-17 15:16
今日上午,2025小米"人车家全生态"合作伙伴大会在北京举办,《每日经济新闻》记者现场参会。会上,小米官宣开源并上线Xiaomi MiMo-V2- Flash大模型。与此同时,记者还注意到,在这次会上,MiMo大模型负责人罗福莉首次公开亮相。这位被业界称为"AI才女"的95后技术专家,介 绍了小米大模型的具体情况,并谈及自己对AI的相关看法。 在活动现场,罗福莉的表现稍显紧张,所介绍内容以技术解读为主。罗福莉提到,研发之初主要围绕三个问题展开:智能体必须有一个高效的沟 通语言,即代码能力和工具调用能力;目前智能体之间的沟通带宽非常低,该如何加速带宽;如何激发后训练的潜能。 图片来源:小米"人车家全生态"合作伙伴大会 据罗福莉介绍,Xiaomi MiMo-V2-Flash是一个非常小的模型,总参数只有309B,激活参数只有15B。"我都不愿意称它是一个非常大的模型。但是 它的代码能力,在我来看它已经进入了全球top 2"。 图片来源:每经记者 杨卉 摄 罗福莉称,Xiaomi MiMo-V2-Flash在大部分评测基准上超过了DeepSeek V3.2 和K2-Thinking,同时对比参数量减少了二分之一至三 ...
何小鹏:当前没有AI泡沫!
证券时报网· 2025-12-17 14:53
何小鹏也最新谈及了对"物理AI"的理解。 (原标题:何小鹏:当前没有AI泡沫!) 小鹏汽车董事长何小鹏近日在美国和近三十位AI领域的外部和内部朋友聊天,他对中美AI竞逐和产业 生态等有了最新判断。 关于美国的新创业和机器人,何小鹏认为,美国在AI,生物,金融方面的创业多。"对于AI方面的创 业,从硅谷看,在SaaS和物理AI机器人领域特别多,估值也特别高,我这次聊了其中一半都是做机器 人创业的朋友,非常集中。" 对比来看,中国的机器人公司很多是从关节和控制入手,而美国的机器人公司很多是从模型入手。何小 鹏认为,人形机器人将来会是巨头的竞争,而不同的专用机器人则会有大量不同领域的选手,且会有非 常多的成功机会。 今年11月中旬,2025小鹏科技日举办。活动现场,何小鹏强调了"物理AI"概念,并围绕"物理AI"发布了 四项重要应用,包括小鹏第二代VLA、小鹏Robotaxi、全新一代IRON,以及汇天两套飞行体系,勾勒 出物理AI未来出行的清晰图景。 让市场更为关注的是,这些AI应用已有明确的量产计划。小鹏汽车表示,"物理AI"并非遥不可及,而是 人人触手可及的现实。 他表示,维特根斯坦曾经说过,"语言即世界"。 ...