大模型
搜索文档
95后AI天才少女,官宣加入小米
21世纪经济报道· 2025-11-12 16:23
前DeepSeek研究员罗福莉加入小米,或致力于推进MiMo大模型研究。 11月12日,罗福莉在朋友圈发文:"智能终将从语言迈向物理世界。我正在Xiaomi MiMo,和一群富有创造力、才华横溢且真诚热爱的研究员,致力于构 建这样的未来,全力奔赴我们心目中的AGI。" 图源:罗福莉个人公众号 在上大学之前,罗福莉几乎没接触过电脑。本科期间,她对计算机专业从迷茫到逐渐专注,大二开始振作起来专注于学习。大三时进入北大语言计算实验 室实习,选择了NLP(自然语言处理)作为自己的科研方向,并在短时间内自学Python并投出一篇顶会论文(非一作)。 被保研至北京大学计算语言学专业后,她在人工智能领域顶级国际会议ACL上发表了8篇论文(其中2篇为一作),迅速走红,并被誉为"AI天才少女"。 据了解,Xiaomi MiMo是小米首个推理大模型。此前,话题"AI才女罗福莉已到新岗位上班"一度登上热搜,罗福莉就职去向引发广泛关注。对此,罗福莉 并未直接回应。2月19日,据媒体报道,罗福莉曾发朋友圈表示,"请互联网还我一片安安静静做事的氛围吧,我不是天才少女,只想安安静静做难而正确 的事情。" 值得注意的是,今年10月,小米AI ...
守擂“AI王冠”,小鹏拆掉的拐杖不止“语言”
21世纪经济报道· 2025-11-12 16:17
文章核心观点 - 公司正将其智能驾驶技术路线从依赖语言作为中间转译环节的“标准VLA”架构,全面转向拆除语言(L)的“第二代VLA”架构,旨在通过“大数据+大算力+大模型”实现能力“涌现”,以突破当前自动驾驶系统的性能上限 [5][7][20][21][24][26] - 公司认为,电动化基础上的智能化才是电动汽车与传统汽车彻底区别开的核心,并将智能驾驶视为汽车行业竞争的下半场核心战场 [5] - 公司通过拆除过往的成功经验和路径依赖,包括暂停标准VLA研发、耗费20亿元进行技术探索,展现了其在物理AI领域作为“孤勇者”的决心,以应对来自华为、理想等竞争对手的激烈挑战 [7][20][36][38][40] 智能驾驶技术演进与领导团队 - 公司的智能驾驶研发经历了从“规则时代”到“规则+算法时代”,再到“VLA小模型时代”,并最终迈向“物理世界模型时代”和“端到端大模型”的技术世代演进 [19] - 智能驾驶业务的领导层实现了平稳交接与薪火相传:吴新宙(2019年3月至2023年8月在任)完成了从供应商方案到自研算法的过渡,并推出了高速NGP和有图城市NGP;李力耘(2023年8月至2025年10月在任)推动了无图城市NGP在超过200个城市的量产落地,并开始训练云端基座大模型;刘先明(2025年10月接任)则致力于验证规模法则在物理世界的可行性,并训练云端物理世界基座大模型 [16][17][19] - 前两任负责人吴新宙和李力耘在规则时代和算法时代的积累,为现任负责人刘先明搭建云端基座模型工厂(特别是其中的奖励函数组件)奠定了基础 [16][17] 第二代VLA技术架构与创新 - 第二代VLA的核心创新在于拆除了标准VLA中的语言(L)转译环节,使模型能够直接从视觉(V)映射到动作(A),从而减少了信息损耗和延迟,并允许在更大参数规模上进行数据训练 [24][26][28][30] - 新架构的训练采用自监督模式,类似于大语言模型的“猜词游戏”,通过预测下一个token的方式让模型直接从海量的“路景-驾驶动作”数据中自行领悟物理世界规律,摆脱了对人工标注和监督的依赖 [28][29][30] - 技术的执行层形成一个闭环:模型先提取环境的关键信息(Latent Tokens),进行世界模拟(World Simulation),然后结合强化学习(Reinforcement Learning)的经验奖励机制,最终输出具体的驾驶动作(Action)或分解为轨迹指令(Trajectory Tokens)来精准控制车辆 [31] 大数据、大算力与大模型的投入规模 - 公司用于训练的视频数据量呈现快速增长:从4月AI技术分享会公布的2000万Clips,到6月CVPR大会公布的5000万Clips(相当于3万部《流浪地球》),再到11月科技日公布的近1亿Clips(相当于驾驶35000年才能遇到的极限场景总和) [25] - 公司的云端智能算力集群规模持续扩张:从4月份已建立的万卡规模,到6月计划向两万卡水平迈进,再到11月科技日宣布已在阿里云上使用3万张卡,并展望明年可能达到5万至10万张卡的规模 [33] - 公司为第二代VLA针对其图灵AI芯片重新开发了编译器和软件栈,并对算子进行了优化,最终实现了推理效率12倍的提升 [35] - 为实现技术突破,公司耗费了超过20亿元进行研发投入,并在相当长一段时间内未看到明确希望 [7][38] 行业竞争格局与技术路线争议 - 公司在VLA大模型路线上正面临华为、理想等竞争对手的挑战:华为公开质疑VLA路线,并宣布其乾崑智驾系统搭载量已突破100万辆;理想汽车则在学术顶会上展示了“世界模型+训练闭环”的最新方案 [6][20] - 竞争对手对VLA路线的批评主要集中在两点:一是其对多模态数据量、算力等资源的需求极为庞大,数据采集和标注难度巨大;二是语言作为中间环节会导致信息丢失和决策延迟,华为智能汽车解决方案BU CEO靳玉志比喻其为“让语言学家去学开车” [20] - 公司意识到,在原有技术框架下通过不断解决极端案例(Corner case)来提升性能的方式已遇到瓶颈,收敛速度可能无法满足实现L4级自动驾驶的要求,因此必须进行根本性的架构创新 [20][21]
“雷军千万年薪要挖”的DeepSeek罗福莉官宣加入小米大模型团队
搜狐财经· 2025-11-12 15:43
11 月 12 日消息,去年底有消息称,DeepSeek 开源大模型 DeepSeek-V2 的关键开发者之一罗福莉将加入小米。第一财经新皮层知情人士称,雷军认为小 米在大模型领域发力太晚,于是亲自挖人,重金招募能够领军小米大模型的人才,支付的薪酬水平在千万元级别。 今日,博主 @粮厂研究员Will 晒出截图,罗福莉在朋友圈官宣加入小米 Xiaomi MiMo 大模型团队。 智能终将从语言迈向物理世界。我正在 Xiaomi MiMo,和一群富有创造力、才华横溢且真诚热爱的研究员,致力于构建这样的未来,全力奔赴我们心目 中的 AGI! 值得一提的是,小米和北京大学联合署名的论文于今年 10 月现身 arXiv,罗福莉就已经出现在这篇论文的通讯作者之列。 据IT之家此前报道,今年 4 月,小米开源首个"为推理而生"的大模型 Xiaomi MiMo,联动预训练到后训练,全面提升推理能力。据介绍,MiMo 是来自全 新成立的"小米大模型 Core 团队"的初步尝试。 【来源:IT之家】 ...
共创自然资源数据应用新生态 自然资源行业高质量数据集建设与创新应用论坛成功举办
搜狐网· 2025-11-12 15:39
2025年11月7日,于浙江德清召开的第二届中国测绘地理信息大会期间,"自然资源行业高质量数据集建 设与创新应用论坛"成功举行。本次论坛由自然资源部网络安全和信息化领导小组办公室、自然资源部 科技发展司指导,自然资源部信息中心、国家数据发展研究院、自然资源部国土空间大数据工程技术创 新中心、中国地理信息产业协会智慧国土工作委员会、中国地理信息产业协会自然资源信息工作委员 会、山东省土地发展集团有限公司、北京数慧时空信息技术有限公司联合承办,旨在汇聚行业顶尖智 慧,共商数据建设标准,共享创新应用成果,共创自然资源数据应用新生态。论坛吸引了来自政府、企 业、科研院所的众多专家与业内人士,成为大会期间备受瞩目的焦点活动。 自然资源部信息中心副主任兼总工程师吴洪涛在题为《自然资源行业高质量数据集构建与后土大模型应 用探索》的报告中,高屋建瓴地指出,高质量数据集已成为全球AI竞争的战略焦点。他描绘了自然资 源高质量数据集建设的闭环体系:从"数据精炼场"(数据供给)到"用数实验室"(数据赋能),再到"价值运 营中心"(数据服务),最终形成"大模型开放数字生态"(共建共享)和"行业大模型标准体系"(统一标准)。 他特别指出 ...
雷军“千万年薪”挖角传闻落地!前DeepSeek“天才少女”官宣加盟小米
观察者网· 2025-11-12 15:32
核心事件概述 - 前DeepSeek研究员罗福莉于2025年11月12日通过朋友圈正式确认加入小米,在MiMo团队工作[1] - 罗福莉的加盟为小米的AI战略,特别是“端侧AI”与“人车家全生态”提供了关键技术支持[1] - 罗福莉在声明中表示其工作目标是“智能终将从语言迈向物理世界”,致力于构建AGI未来[1] 罗福莉职业背景与技术专长 - 罗福莉拥有北京师范大学计算机专业学士学位和北京大学计算语言学研究所硕士学位[4] - 其在2019年读研二期间,在人工智能顶级会议ACL上一次性发表8篇论文,其中2篇为第一作者[4] - 研究生毕业后进入阿里达摩院,主导开发了多语言预训练模型VECO,该模型被纳入阿里深度语言模型体系AliceMind[5] - 2022年加入幻方量化旗下DeepSeek,参与研发以“性价比之王”著称的MoE架构大模型DeepSeek-V2,该模型中文水平处于国内外闭源模型第一梯队,价格仅为GPT-4的1/100[5] - 在DeepSeek期间展现出对开源社区的深刻理解,曾亲自撰写技术解读[5] - 值得注意的是,罗福莉并未参与今年年初让DeepSeek爆火的V3和R1模型的研发工作,并已离开DeepSeek[7] 加盟小米的传闻与前期合作 - 关于罗福莉加盟小米的传闻始于2024年12月,传闻称小米创始人雷军亲自以千万年薪级别力邀其领导大模型团队[8] - 2025年2月,有亲属表示罗福莉已到新岗位上班,但当时小米员工系统并无其信息,本人也未透露去向[8] - 2025年10月14日,小米与北京大学联合署名的论文发表于arXiv,罗福莉位列通讯作者,表明双方已进行深度合作[9] - 2025年9月,罗福莉在知乎点赞了小米语音大模型Xiaomi-MiMo-Audio的开源帖子[12] 小米的AI战略与技术路径 - 小米AI实验室成立于2016年初,研究方向涵盖视觉、声学、语音、自然语言处理等全栈技术领域[13] - 2023年4月,小米AI实验室下设专门的大模型团队[13] - 公司AI思路与当时主流观点不同,明确表示“不会做ChatGPT,不搞AI的军备竞赛”,认为轻量级模型存在市场空间并在特定任务上具有优势[13] - 2023年8月,雷军在年度演讲中提出小米的AI战略是轻量化+本地部署的思路,现场展示的MiLM-1.3B模型参数量远低于当时行业几十B起步的水平[14] - 2024年,雷军亲自推动小米GPU万卡集群建设,年中已拥有6500张GPU,并计划扩容至万卡规模[17] - 2025年2月,雷军宣布小米2025年研发费用将超300亿元,其中约75亿元(1/4)用于AI领域,重点投向GPU集群、大模型开发及场景落地[17] - 未来五年(2026-2030年),公司研发投入预计超2000亿元,聚焦AI、OS、芯片三大底层技术,作为“人车家”生态的技术底座[17] MiMo团队与技术成果 - 罗福莉加入的MiMo团队是小米的推理大模型团队,来自新成立的“小米大模型Core团队”[14] - 2025年4月,小米开源首个“为推理而生”的大模型Xiaomi MiMo,仅用70亿参数就在数学推理和代码竞赛测评中超越了OpenAI的闭源模型o1-mini和阿里320亿参数的开源模型QwQ-32B-Preview[14] - 这一成绩验证了小米“小参数大能量”的技术路径[14] 行业趋势与战略意义 - 顶尖AI研究员从DeepSeek等新锐公司流向小米等传统硬件巨头,暗示AI大模型竞争进入“应用深化期”[17] - 当基础模型能力逐渐收敛,如何将AGI理想转化为手机、汽车、智能家居中的真实体验成为新的赛点[17] - 罗福莉的复合经验将为小米汽车在端侧AI、多传感器融合、拟人化交互等方面提供关键技术支持[13]
雷军“千万年薪”挖角传闻落地!前DeepSeek“天才少女”加盟小米
观察者网· 2025-11-12 15:32
罗福莉加盟小米事件 - 前DeepSeek研究员罗福莉于2025年11月12日通过朋友圈正式确认加入小米 [1] - 罗福莉在小米的工作领域不仅限于大模型开发 还涉及大模型在手机 汽车等终端产品的落地 [1] - 罗福莉将加入小米的MiMo团队 该团队是小米的推理大模型团队 [14] 罗福莉背景与职业轨迹 - 罗福莉被称为"95后天才少女" 1995年出生于四川宜宾 [4] - 2019年读研二期间在人工智能领域顶级国际会议ACL上一次性发表8篇论文 其中2篇为第一作者 [5] - 研究生毕业后进入阿里达摩院做人工智能研究 主导开发多语言预训练模型VECO [5] - 2022年加入量化私募幻方量化 随后进入其研究部门DeepSeek担任深度学习研究员 参与MoE大模型DeepSeek-V2研发 [5] - DeepSeek-V2以"性价比之王"著称 价格仅为GPT-4的1/100 [5] 加盟过程时间线 - 2024年12月有传闻称小米创始人雷军以千万年薪级别力邀罗福莉 [6] - 2025年2月有罗福莉亲属表示其已到新岗位上班 但未透露具体去向 [3] - 2025年10月14日 小米与北京大学联合署名的论文发表于arXiv 罗福莉位列通讯作者 [9] - 2025年9月罗福莉在知乎点赞了小米语音大模型Xiaomi-MiMo-Audio的开源帖子 [12] 小米AI战略布局 - 小米AI实验室成立于2016年初 2023年4月下设专门的大模型团队 [13] - 小米坚持"轻量化"路线 不走"大参数"竞赛 内部认为轻量级模型存在市场空间 [13] - 2023年8月雷军提出小米AI战略是轻量化+本地部署思路 [15] - 2024年雷军推动小米GPU万卡集群建设 已拥有6500张GPU 后续将扩容至万卡规模 [17] - 2025年雷军宣布小米研发费用将超300亿元 其中1/4(约75亿元)用于AI领域 [17] 技术协同与行业意义 - 罗福莉在DeepSeek积累的MoE架构等大模型训练经验与小米"端侧AI"战略高度契合 [1][13] - 小米开源的首个"为推理而生"大模型Xiaomi MiMo仅用70亿参数就超越了OpenAI的o1-mini和阿里Qwen的320亿参数模型 [15] - 顶尖AI研究员从新锐公司流向硬件巨头 暗示AI大模型竞争进入"应用深化期" [17] - 行业竞争焦点转向如何将AGI理想转化为手机 汽车 智能家居中的真实体验 [18]
奔赴AGI!前DeepSeek研究员罗福莉官宣加入小米
21世纪经济报道· 2025-11-12 15:04
11月12日,罗福莉在朋友圈发文:"智能终将从语言迈向物理世界。我正在Xiaomi MiMo,和一群富有创造力、才华横溢且真诚热爱的研究员,致力于构建 这样的未来,全力奔赴我们心目中的AGI。" 据了解,Xiaomi MiMo是小米首个推理大模型。此前,话题"AI才女罗福莉已到新岗位上班"一度登上热搜,罗福莉就职去向引发广泛关注。对此,罗福莉并 未直接回应。2月19日,据媒体报道,罗福莉曾发朋友圈表示,"请互联网还我一片安安静静做事的氛围吧,我不是天才少女,只想安安静静做难而正确的事 情。" 前DeepSeek研究员罗福莉加入小米,或致力于推进MiMo大模型研究。 值得注意的是,今年10月,小米AI团队携手北京大学联合发布一篇聚焦MoE与强化学习的论文,其中已经出现罗福莉的名字,再次引发市场对罗福莉就任 新职的猜测。 公开资料显示,罗福莉本科毕业于北京师范大学计算机专业,硕士阶段进入北京大学计算语言学深造。硕士毕业后,罗福莉加入阿里巴巴达摩院,担任机器 智能实验室研究员,负责开发多语言预训练模型VECO,并推动AliceMind项目的开源工作。 2022年,罗福莉加入DeepSeek母公司幻方量化从事深度学习 ...
利率收窄、合规趋严,消费金融机构谋变
21世纪经济报道· 2025-11-12 12:17
行业核心观点 - 消费金融行业面临资产质量下行、利率空间收窄、竞争加剧及监管收紧等多重挑战,但年轻消费群体崛起和金融科技应用也带来新的发展机遇 [1] 行业面临的挑战 - 行业不良贷款规模达246.32亿元,同比增幅32.96%,不良资产转让价格持续低迷 [4] - 监管明确利率上限后利率持续走低,31家持牌消费金融公司加剧市场竞争,进一步压缩利率空间 [4] - 监管政策收紧,最低注册资本金提升至10亿元,主要出资人持股比例要求从30%提高至50%,担保融资业务余额不得超过全部贷款余额的50% [4] - 市场参与主体多元,银行信用卡和自营消费贷市场份额分别达42%和20%,导致获客成本攀升、产品同质化严重 [5] 行业发展的机遇 - 年轻群体成为消费主力,其“活在当下”的消费观念和高度依赖线上场景的习惯催生新需求 [7] - 金融科技成为破局关键,大模型、大数据、区块链与云计算等技术正重构服务体系 [7] - 大模型可赋能智能客服、风险评估与反欺诈;大数据实现实时风控和用户画像;区块链提升交易透明度与安全性;云计算支撑业务快速扩展 [7] 创新与合规的路径 - 创新需将人工智能、区块链等前沿技术融入风控、获客环节,并聚焦消费场景提供差异化金融解决方案 [3] - 合规需构建全流程合规体系,业务运营和算法设计均要符合规范,并紧跟监管新规 [3] - 品牌建设能降低获客成本、增强用户信任,是长期竞争力的关键 [3] 技术应用与实践 - AI应用需突破“知识转化”与“持续进化”瓶颈,建立“业务反馈-数据回流-模型优化”的链条才能深度融入业务 [8][9] - 采用“知识转化-模型执行-动态反馈”的AI应用体系,在催收、贷款审批等场景实现精准决策 [10] - 借鉴大模型方法论,通过声纹识别、视频/图像识别提升身份核验精度,利用智能决策平台自动化优化模型融合与额度定价 [12] 客户经营与生态构建 - 在存量经济时代,“爱护客户”是实现高质量发展的根基,需注重客户关系的长期稳定性 [10] - 针对下沉用户信用数据缺失问题,创新引入“非标准化凭证认证”模式,让缺乏传统资质的群体获得金融支持 [11] - 通过联合地方银行、担保机构搭建“普惠金融联盟”,并深度融入地方产业生态,实现生态协同 [11]
Z Potentials|张泽夏,Retell AI CTO,从Google到企业级AI电话客服,年收入破3600万美元
Z Potentials· 2025-11-12 11:23
过去两年,语音技术悄然跨过一个新的临界点。过去它只是 " 能听懂 " ,如今已开始 " 能思考、能回应 " 。这一跃迁并非来自单一算法的突破,而是语 音、语言模型与实时交互系统的深度融合。当 AI 具备即时推理与生成能力后,语音通话不再只是信息传递工具,而成为企业自动化的前线入口。客服、销 售、预约、调度 —— 凡是 " 需要沟通 " 的场景,都在被重新定义。 在这场重塑中, Retell AI 是跑得最快的公司之一。这家成立不到两年的语音智能平台,年收入已突破 3600 万美元,服务数千家企业客户,在北美与亚太 市场均实现了稳定复购。 Retell 让机器第一次在 " 打电话 " 这件事上接近人类 —— 延迟几乎不可察觉,语气自然、理解上下文、能实时完成任务。 无论是美国车企的维保预约系 统,还是中国出海品牌的全球客服中心, Retell 的语音代理正悄然取代传统坐席。 企业不再需要动辄数百人的呼叫中心,却能获得更高的转化率和客户满 意度。 这家公司的技术灵魂是联合创始人兼 CTO 张泽夏 。毕业于南加州大学( USC ),在 Google 先后负责 Call Ads 与 Speech Translatio ...
太突然,OpenAI挖走了英特尔CTO
36氪· 2025-11-12 09:35
核心人事变动 - 英特尔首席技术官兼人工智能部门负责人Sachin Katti在任职仅8个月后突然离职,加盟OpenAI [1] - 英特尔首席执行官陈立武将兼任负责Katti此前领导的人工智能部门 [1] - Sachin Katti于2021年加入英特尔,最初担任网络与边缘计算组首席技术官,于2024年4月升任首席技术官兼首席人工智能官 [7] 英特尔公司影响 - 此次人事变动被视为对英特尔的重大损失,公司表示人工智能仍是其最重要的战略重点之一 [3][11] - 在Katti任职的8个月内,英特尔将人工智能从数据中心子业务提升至公司级战略地位,并集中资源研发新一代GPU和AI加速器 [7] - 公司强调正专注于在新兴AI工作负载领域执行其技术和产品路线图 [11] OpenAI公司战略 - Sachin Katti在OpenAI的新职责是设计和构建计算基础设施 [1][12] - 此次招聘是OpenAI在算力布局上的重要一步,公司近期动作包括联手甲骨文和软银建设吉瓦级AI数据中心,与博通合作开发自研AI芯片 [14] - OpenAI首席执行官Sam Altman曾表示计划在未来8年内投入1.4万亿美元建设数据中心 [14] 个人背景信息 - Sachin Katti拥有印度理工学院孟买分校本科学位和麻省理工学院计算机科学博士学位 [5] - 除工业界职务外,他自2016年起在斯坦福大学担任副教授并获得终身教职,2023年后转为兼职教授 [7]