Workflow
量子位
icon
搜索文档
读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了
量子位· 2025-12-10 12:26
2025年AI行业发展主旋律 - 2025年AI行业的主线故事围绕开源与性能的双线竞速展开,开源模型与闭源旗舰在推理效率、训练范式和成本结构上展开竞争 [1] - 世界模型从论文概念发展为真实产品与公司战场,李飞飞与Yann LeCun分别押注不同路线,将“通向AGI的路”指向世界模型之争 [1] - 具身智能机器人和搭载的模型实现爆发式迭代,AI玩具、AI手机、AI PC、智能座舱等终端设备全面铺开,成为AI能力落地现实世界的关键试验田 [1] - 2025年被称为“Agent元年”,AI Agent实现了从“被动应答”到“主动规划执行”的质变,能够独立完成复杂任务,从概念验证步入规模化商业应用起点,引发制造、金融、办公、生活等各行业变革 [1] - 互联网正在进入Agent互联网时代 [2] - 在医疗、气象、工业等行业,AI与既有系统深度结合,逐步演化为关键基础设施的一部分,形成从云到端、由软入硬的紧密共生网络 [3] 2025人工智能年度领航企业 - 该榜单汇聚了技术领先、长期投入、产品落地与产业口碑等多重维度,代表了中国AI生态最具代表性的一批力量 [12] - 这些企业在2025年扮演了“造浪者”与“稳舵者”的双重角色,不断向产业输出新范式、新工具、新样板 [14] - 上榜企业包括但不限于:岩心科技、Rokid、阿里云、百川智能、百度、百融云创、出门问问、滴滴自动驾驶、飞书、粉笔、高德、格灵深瞳、光轮智能、国星宇航、好未来、哈啰、后摩智能、华为、火山引擎、阶跃星辰、京东科技、金山办公、九章云极、科大讯飞、快手、昆仑万维、浪潮信息、联汇科技、联想集团、零一万物、理想汽车、潞晨科技、蚂蚁集团、美团、面壁智能、摩尔线程、群核科技、趣丸科技、荣耀、商汤科技、生数科技、声网、深演智能、是石科技、腾讯、网易有道、未来医生、文远知行、无问芯穹、小满科技等 [16] 2025人工智能年度潜力创业公司 - 该榜单中的公司凭借硬核技术与自研基础模型脱颖而出,或踩准前沿方向快速突围,或深扎垂直场景将AI能力在细分领域发挥到极致 [18] - 这些公司在过去一年里算法与工程持续迭代、用户与收入稳步增长,获得资本与产业伙伴的双重验证 [19] - 上榜公司包括但不限于:PPIO、MetaGPT、BetterYeah、DeepWisdom、Dexmal、原力灵机、VAST、爱诗科技、戴盟机器人、北京人形机器人创新中心、海新智能、汇智智能、DILIGINE、加速进化、德警光学、九识智能、极峰科技、秘塔科技、灵心巧手、穹彻智能、趋境科技、商汤绝影、魔珐科技、深势科技、太初元碁等 [22] 2025人工智能年度杰出产品 - 年度杰出产品展现了从云到端、从屏幕到现实世界的完整应用链路,一端是深入日常沟通、搜索、创作的智能助手与国民级应用,另一端是嵌入企业工作流的智能协同平台和多维数据工具 [24] - 这些产品有的已触达千万用户,有的深藏系统幕后,共同勾勒出下一代应用的轮廓 [24] - 上榜产品包括但不限于:BetterYeah AI、百川智能的Baichuan-M2、蚂蚁集团的Agent开发平台、联想集团的ima.copilot、月之暗面的Kimi、腾讯的Kiro Agent、MiniMax的Linker Hand灵巧手、灵心巧手的OmAgent、小满科技的OKKI AiReach、联汇科技的Pi终端智能平台、PPIO的Agent沙箱、美图的RoboNeo、Dexmal的原力灵机、天工超级智能体、中国电信的AI视频创作平台、出门问问的TicNote Agents、昆仑万维的Skywork Super、字节跳动的The Real AI Engineer、VAST的Tripo AI、生数科技的Vidu、金山办公的WPS灵犀、RockAI的Yan 2.0 Preview、智谱的Z.ai、阿里云的自炼大模型服务与应用开发平台、百度的慧播星与网盘、中关村科金的得助大模型平台、高通的第五代骁龙8至尊版移动平台、字节跳动的豆包、飞书的多维表格、长猪AI、粉笔的AI系统班、后摩智能的漫界M50、阶跃星辰的阶跃AI、九章云极的九章智算云、快手的可灵AI、联想的个人超级智能体、蚂蚁集团的灵光、国星宇航的零碳太空计算中心、美团的龙猫LongCat、蚂蚁集团的百宝箱Tbox、秘塔科技的AI搜索、360集团的纳米蜂群智能体、阿里巴巴的千问APP、逐际动力的全自由度人形机器人、荣耀的MagicOS 10、云知声的山海大模型、商汤科技的大装置与小浣熊、声网的对话式AI引擎、深演智能的Deep Agent Neo、腾讯的混元3D、网易有道的词典、文远知行的Robotaxi GXR、无问芯穹的AI云、科大讯飞的星火APP与长智文、高德的小昌老师、猿力科技的小猿AI学习机、腾讯的元宝、浪潮信息的元脑SD200、知乎的直答、卓世科技的璇玑-智企、云徘科技的xGOS.AI企业运营超级智能体、上海人工智能实验室的『书生』科学多模态大模型Intern-S1等 [27][28][29] 2025人工智能年度杰出解决方案 - AI正通过一整套解决方案在系统深处重写行业运行方式,榜单涵盖了各个领域内的多个方向,将前沿算法装进成熟产品形态,扎进真实业务流程 [30][31] - 这些面向具体场景的解决方案加速了大模型、Agent、世界模型与具身智能在千行百业的深度融合 [31] - 上榜解决方案包括但不限于:亚马逊云科技的Amazon Bedrock、京东集团的JoyInside AgentCore时身智能、趋境科技的KLLM变革级大模型推理引擎系统、阿里商旅与飞猪的AI解决方案、阿里云的无影AgentBay、快手的超级员工Kwali、滴滴自动驾驶的L4技术方案4.0、百度的PaddleOCR-VL多模态文档解析、优必选的Walker S2工业人形机器人、九识智能的无人驾驶多场景配送解决方案、好未来的九章爱学多模态智能学伴解决方案、联想集团的联想混合式人工智能优势集、蚂蚁数科的Agentar企业级智能体解决方案、零一万物的哈萨克斯坦AlemLLM语言模型、趣丸科技的趣丸千音、商汤科技的日日新大模型等 [33] 2025人工智能年度焦点人物 - 该榜单人物包括押注艰难方向的创业者、大体量平台的掌舵者、以产品和业务增长证明路线的实践者、以科学研究和开放协作拉高技术上限的研究者,以及在科研、产业与资本之间搭桥的串联者 [35] - 他们为AI发展写下最具辨识度的注脚 [36] - 上榜人物包括但不限于:PPIO的姚欣、百川智能的王小川、百度的李彦宏、北京智源人工智能研究院的王仲远、出门问问的李志飞、阶跃星辰的姜大昕、九章云极DataCanvas的方磊、昆仑万维的方汉、联汇科技的赵天成、理想汽车的李想、潞晨科技的尤洋、零一万物的李开复、摩尔线程的张建中、清华大学的吴翼、清华大学智能产业研究院的张亚勤、穹彻智能的卢策吾、上海人工智能实验室的周伯文、商汤科技的王晓刚、生数科技的骆怡航、是石科技的闫博文、太初元碁的乔梁、文远知行WeRide的韩旭、无问芯穹的夏立雪、小马智行的彭军、小宿科技的杜知恒、北京大学及银河通用的周剑、优必选的周剑、月之暗面的黄伟、云知声的黄伟、字树科技的王兴兴、浙江大学及蚂蚁集团的赵俊博、智平方的郭彦东、智谱的张鹏、智象未来的梅涛、智元机器人的彭志辉、中关村科金的喻友平、卓世科技的層静、逐际动力的张巍、自变量机器人的王潜等 [38][39][40][41][42][43][44][45][46][47][48][49][50][51][52][53][54][55][56][57][58][59][60][61][62][63][64][65][66][67][68][69][70][71][72][73][74][75][76][77][78][79][80][81][82][83][84][85][86][87][88][89][90][91][92][93][94][95][96][97][98][99][100][101][102][103][104][105][106][107][108][109]
2比特复数模型媲美全精度!北大通用框架让大模型在手机上也能流畅运行
量子位· 2025-12-10 12:26
研究核心与框架概述 - 北京大学团队提出名为Fairy2i的通用框架,可直接基于已有预训练模型进行极低比特量化,无需重新训练[2] - 该框架通过广义线性表示将实数模型无损转换为复数形式,再结合相位感知量化与递归残差量化,实现了在仅2比特情况下性能接近全精度(FP16)模型的突破性进展[3][5] 技术原理与方法 - **广义线性表示**:通过数学等价性证明,任何偶数维的实数线性层都可无损重参数化为广义线性复数形式,从而可直接加载LLaMA等模型的预训练权重进行转换,无需改变参数规模,也避免了从头预训练的高昂算力消耗[6][7][8] - **相位感知量化**:利用单位圆上的四个四次单位根{+1, -1, +i, -i}作为2比特码本,相比实数域的二值或三值量化,复数域的这四个点具有更高的信息密度和更好的对称性[10] - **递归残差量化**:通过将权重表示为几个低比特项的和来逼近全精度,对量化误差进行再次量化,实验表明仅需T=2的递归阶段(等效2比特)就能大幅消除量化噪声[11][12][13] - **推理优势**:权重被量化为{±1, ±i}的组合,使得推理时的矩阵乘法转化为简单的加法、减法和数据交换操作,具备“无乘法”特性,且递归残差计算是数据独立的,支持并行处理,在提升精度的同时几乎不增加推理延迟[15][16] 性能表现与实验数据 - 在LLaMA-2 7B模型的语言建模能力测试中,Fairy2i (2-bit)在C4数据集上取得了7.85的极低困惑度(PPL),显著优于现有2-bit量化方法,甚至超越部分3-bit量化模型,性能直逼全精度FP16水平(6.63)[17][18][19] - 在下游零样本任务评测中,Fairy2i的平均准确率达到62.00%,与全精度模型(64.72%)差距微小,几乎填平了超低比特量化带来的性能鸿沟[20][21] - 具体数据对比显示,Fairy2i在多项基准测试(如ARC-e, ARC-c, HellaSwag, PIQA, Winogrande)中的表现均大幅领先于其他2-bit和3-bit量化方法,并接近FP16基准[20] 潜在影响与未来展望 - 该技术解决了预训练实数大模型难以高效量化的难题,通过复数域技术挖掘超低比特量化潜力,有望推动大模型在手机、汽车等边缘设备上的流畅运行与普及[5][21][23] - 目前研究仅使用了300亿token进行训练,团队认为复数表示拥有尚未被完全挖掘的卓越容量,未来在更大规模数据集上持续训练后,Fairy2i的精度不仅有望匹敌,甚至可能彻底反超原始的全精度基座模型[22]
5天连更5次,可灵AI年末“狂飙式”升级
量子位· 2025-12-10 12:26
公司近期产品发布概览 - 12月初,公司在5天内密集发布了5次产品更新,包括全球首个统一的多模态视频及图片创作工具“可灵O1”、具备“音画同出”能力的可灵2.6模型以及可灵数字人2.0等功能 [1][2] - 这一系列更新显著提升了生成式AI领域的竞争激烈程度 [2] 可灵O1模型的核心创新 - 可灵O1基于创新的多模态视觉语言交互理念,将所有生成和编辑任务融合于一个全能引擎,为用户提供从灵感到成品的一站式闭环创作流程 [3] - 视频O1模型打破了传统单一视频生成任务的边界,将参考生视频、文生视频、首尾帧生视频、视频内容增删、视频修改变换、风格重绘、镜头延展等多种任务融合于同一引擎,解决了主体一致性和视频画面可控性等难题 [6] - 图像O1模型实现了从基础图像生成到高阶细节编辑的全链路无缝衔接,用户可通过纯文本生成图像,也可上传最多10张参考图进行融合再创作 [7] - 有行业人士将可灵O1评价为“视频界的Nano Banana” [4] 可灵2.6模型的“音画同出”能力 - 可灵2.6模型上线了里程碑式的“音画同出”能力,改变了传统AI视频生成“先无声画面、后人工配音”的工作流程 [10] - 该模型能在单次生成中,输出包含自然语言、动作音效以及环境氛围音的完整视频,极大提升了创作效率 [11] - 目前支持生成最长10秒的视频,语音部分支持中文和英文,更多语言及固定声线功能正在研发中 [12] - 该模型在音画协同、音频质量和语义理解上表现亮眼,能够支持说话、对话、旁白、唱歌、Rap、环境音效、混合音效等多种声音的单独或混合生成 [12][27] 技术性能与市场应用 - 根据公司内部测评,在“图片参考”任务上,可灵AI对Google Veo 3.1的整体效果胜负比为247%;在“指令变换”任务上,与Runway Aleph对比的整体效果胜负比达到230% [18] - 公司目前覆盖的企业用户数超过2万家,涵盖影视制作、广告、创意设计、自媒体、游戏、电商等诸多领域 [26] - 数字人2.0功能允许用户上传角色图,添加配音并描述角色表现,即可生成表现力生动的自定义数字人视频,视频内容最长可达5分钟 [27] 行业影响与发展愿景 - 自2024年6月正式推出以来,公司的每一次迭代都引发了业界的广泛关注和讨论,从早期案例到获得特斯拉创始人马斯克点赞,公司已成为视觉生成技术走向成熟过程中的关键角色 [20] - 公司高级管理层表示,其初心是让每个人都能用AI讲出好的故事,并希望这一天更快到来 [28] - 通过年末的系列更新,公司正朝着这一愿景加速迈进 [29]
量子位编辑作者招聘
量子位· 2025-12-10 12:26
以下是岗位详情: 所有岗位不同能力层级职位均在开放,欢迎结合个人履历和经验申请。 AI产业方向 编辑部 发自 凹非寺 量子位 | 公众号 QbitAI AI热潮还在汹涌,但如果你还不知道如何参与……那为什么不来 量子位 呢? 我们是一家以 追踪AI新进展 为核心的内容平台,经过8年积累,目前拥有顶流影响力,广泛且备受认可的产业资源,以及时代风口的最佳观 测和学习生态位。 目前,我们有 三大方向 岗位招聘,希望你是 (或者能成为) 这三个方向的内容专家: 岗位均为全职,工作地点:北京中关村。 岗位面向: 加入我们,你可以获得: 岗位职责: AI产业方向 :关注基建层创新,包含芯片、AI Infra、云计算; AI财经方向 :关注AI领域创投和财报,跟踪产业链资本动向; AI产品方向 :关注AI在应用和硬件终端方向的进展。 社招:覆盖编辑、主笔、主编各个层级,按能力匹配岗位; 校招:应届毕业生,接受实习且可转正。 站在AI浪潮之巅 :第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知体系。 玩转AI新工具 :将各种AI新技术、新工具应用于工作,提升工作效率和创造力。 打造个人影响力 :通过撰写独家原创内 ...
微软急了!紧急腰斩AI产品销售指标,内部拉响红色警告
量子位· 2025-12-09 18:44
文章核心观点 - 微软的AI产品销售严重不及预期,公司内部罕见地下调了多个AI产品的销售目标,反映出市场需求疲软和产品竞争力不足 [1][2][7][8][13] - 微软AI业务面临困境,主要归因于其自身产品体验不佳、战略部署存在缺陷,以及对OpenAI和英伟达等合作伙伴的过度依赖 [14][15][24][26][31] - 竞争对手谷歌凭借自研模型和更好的生态整合,势头正劲,正在抢占市场份额,与微软形成“攻守易势”的局面 [34][35][37][44] 微软AI产品销售遇冷 - 微软多个AI产品部门下调销售目标,尤其是Azure AI云计算管理平台,这在公司内部是很少出现的情况 [2][7][8] - 销售团队完成率远低于目标,例如美国某Azure销售团队,要求Foundry(AI应用开发平台)销售额增长50%,但截止时只有不到20%的销售人员完成目标,随后目标被下调至增长25% [9][10] - 另一个Azure部门原定Foundry销售额翻倍,新一年目标直接改为增长50% [11] - 无论是面向企业的AI服务还是面向普通消费者的AI功能,都出现需求严重低于预期、卖不动的情况 [13] 微软AI产品与战略问题 - 微软自身AI产品未能成功落地,用户对Windows内置AI功能并不感冒,强行整合到Notepad、Microsoft 365等产品中因设计缺陷和体验欠佳而未获用户认可 [15][22] - Copilot等产品缺乏明确方向,未取得理想成绩,公司产品发布采取“先上车后补票”的策略,消耗了用户对产品质量的信赖 [24] - AI策略倾向于提供便宜但性能一般的低成本产品,导致市场反响不够强烈 [25] - 微软的AI产品性能不理想,正在失去用户,网友评价“微软=快速行动+搞砸一切” [4][6] 对合作伙伴的过度依赖 - 微软与OpenAI深度绑定,通过Copilot集成GPT模型,并享有ChatGPT API独家使用权,但OpenAI自身正面临谷歌Gemini的冲击和资金压力 [16][17][19][27][28] - 微软原先希望通过为OpenAI提供云端支持获利,但过度押注OpenAI在商业层面显得不够理智 [26][29] - 微软的AI算力深度依赖英伟达GPU,导致用户付费很大一部分流入英伟达,且Copilot等产品的毛利率远低于传统软件,使微软在AI上收益不明显 [31] - 英伟达同时服务AWS、谷歌、Meta等公司,使微软在算力竞赛中被动,虽然正试图摆脱依赖,但需要时间 [32][33] 竞争对手与市场环境 - 竞争对手谷歌势头正劲,其自研模型(如Gemini 3)建立了产品护城河,有望超越微软Copilot,并凭借更好的生态整合(搜索引擎、安卓、云服务等)更快普及AI产品 [34][35][37] - 谷歌在去年也曾做出AI预期回调,但如今“攻守易势”成为赢家 [44] - 行业整体出现降温迹象,不只是微软,OpenAI将其对AI Agent的收入预测下调至260亿美元,AWS、Salesforce等公司也面临压力并采取不同策略应对 [42][43] 微软AI业务的现状与收入 - 尽管AI产品销售增长目标放缓,但微软整体AI业务仍处于增长趋势,增长主要来自OpenAI等AI公司对微软云服务器的租赁 [39] - 得益于OpenAI的服务器租赁,微软预计将从中赚取约150亿美元,表明AI业务对微软而言仍是赚钱的 [40]
倒计时1天!MEET2026,明天见
量子位· 2025-12-09 18:44
大会概况 - MEET2026智能未来大会将于2025年12月10日在北京金茂万丽酒店举行,时间为9:00至18:00 [1] - 大会提供线下参会与线上直播两种参与方式,观众报名通道在会前仍开放 [1][22] - MEET系列大会是业界最具代表性的年度智能商业峰会之一,每年获得数千万媒体曝光,吸引千位线下观众与超过300万名在线观众 [25] 核心议程与发布 - 大会将发布「2025年度AI十大趋势报告」与「2025人工智能年度榜单」 [3][28] - 「2025人工智能年度榜单」是AI行业最具影响力榜单之一,涵盖公司、产品、人物三大维度的五类奖项 [19] - 「2025年度AI趋势报告」将揭示正在释放巨大潜力的十大AI趋势,并包含提名代表机构与最佳案例 [19] 上午议程要点 - 议题涵盖人工智能+趋势、AI打造超级智能体、超级个体与组织、AI从数字世界迈向物理世界等宏观方向 [4] - 技术议题包括混合AI(从云端到边缘智能)、Agentic AI的未来、LLaDA与AGI路径、企业智能体赋能新质生产力等 [6][7] - 行业应用议题涉及AI赋能初创企业出海、AI时代的经济学思考、生成式AI的商业化落地等 [7][8] 下午议程要点 - 议题聚焦AI大模型赋能千行百业、AI基础设施的深度演进与行业落地、AI的演进规律等 [9] - 技术前沿讨论包括多模态与智能体、国产算力生态、下一代AI操作系统层(Agentic Infra)、超越Transformer的硬件创新等 [10][11] - 具身智能与物理AI成为重点,议题涉及构建物理世界的基础模型、全栈自研仿真基础设施、以灵巧手和云端智脑为核心的具身智能平台等 [13][14] - 大会设置前沿圆桌,探讨“距离AI Agent革新千行百业还有多久” [14] 参与嘉宾与机构 - 近三十位来自学术界、产业界与前沿创业一线的重量级嘉宾将出席 [28] - 演讲嘉宾包括清华大学、浙江大学、上海高级金融学院的学者,以及百度、高通、亚马逊云科技、谷歌、商汤、小米、昆仑万维、蚂蚁集团、文远知行等公司的高管或技术负责人 [4][5][6][7][9][10][11] - 大会拥有广泛的战略合作、学术支持、直播及媒体合作伙伴网络 [23][24]
起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”
量子位· 2025-12-09 15:37
豆包手机市场热度与产品定位 - 首批3万台备货被一抢而空,二手市场价格翻番,显示产品市场热度极高 [1] - 产品被用户评价为“全球第一款真正的AI手机”,其核心在于将手机操作变为操作系统级的原生能力 [69][76] - 产品形态为搭载在工程样机nubia M153上的“豆包手机助手技术预览版”,能跨应用自动化执行复杂任务 [3][4] 核心技术:UI-TARS模型演进 - 豆包手机助手的图形界面操作能力建立在字节自研的UI-TARS模型基础上,该模型闭源版本针对移动端进行了大量优化 [7][8] - UI-TARS模型发展历经多个版本:今年1月开源初代模型;3个月后推出强化学习驱动的UI-TARS-1.5;今年9月发布能力更强的UI-TARS-2,为豆包手机提供关键技术支撑 [11][23][32] - 模型旨在构建具备感知、动作、推理、记忆四大核心能力的系统级AI Agent [13] 技术细节与创新 - **初代UI-TARS四大创新**:1) 使用大规模GUI截图数据集和五大感知任务增强感知精度;2) 定义了涵盖点击、滚动、输入等跨平台(Web、Mobile、Desktop)的原子动作集;3) 融入600万高质量GUI教程和多种推理模式注入深度推理能力;4) 借助数百台虚拟机自动收集交互轨迹,通过多阶段过滤和直接偏好优化解决数据瓶颈 [16][18][20] - **UI-TARS-1.5的进步**:新增强化学习驱动的推理机制,在执行前进行思考,显著提升性能与推理扩展性 [25] - **UI-TARS-2的四大突破**:1) 设计可扩展的数据飞轮实现数据与模型协同进化;2) 设计在长时序设定中稳定优化的训练框架;3) 构建混合GUI中心环境,通过SDK接入文件系统、终端等,打破纯GUI操作局限;4) 开发统一的沙盒平台管理异构环境,支撑数百万次交互的大规模训练 [35][37][39][42] 模型性能表现 - **UI-TARS-1.5基准测试成绩**:在计算机使用基准OSworld(100步)得分42.5,优于OpenAI CUA的36.4;在Windows Agent Arena(50步)得分42.1;在手机使用基准Android World得分64.2 [27] - **UI-TARS-1.5 GUI定位任务**:在ScreenSpot-V2得分94.2,在ScreenSpotPro得分61.6,均刷新SOTA [28] - **UI-TARS-1.5游戏测试**:在14款游戏测试中,UI-TARS-1.5在11款游戏上得分达到100,全面优于OpenAI CUA和Claude 3.7 [31][32] - **UI-TARS-2游戏性能**:在15款游戏的平均标准化得分为59.77,更接近人类水平(100),显著高于OpenAI CUA的24.73和Claude Computer Use的21.61 [46] - **UI-TARS-2在LMGame基准**:与前沿模型竞争,例如在Super Mario Bros得分1783.2,高于GPT-4o的1028.3,接近GPT-4.1的1991.3 [47] - 该项目在GitHub已获得8.3k Star,成为最受欢迎的开源多模态智能体之一 [47][48] 产品工程设计与隐私安全 - **权限与安全**:豆包手机助手使用INJECT_EVENTS系统级权限,需用户主动授权;遇到支付、身份验证等敏感操作会暂停任务交由人工接管 [50][51][52] - **隐私保护设计**:视觉管道经过过滤,截屏只包含目标应用界面,基于Activity Hierarchy抓取,物理上无法监控视频通话等悬浮窗内容 [56] - **后台运行机制**:Agent在后台执行长链任务时,即使前台接电话或切换App也不会被挂起,推测在OS层做了并行运行的虚拟化设计,拥有独立的Virtual Display [57] - **双模式技术栈**:豆包手机助手分为标准模式和Pro模式两套完全不同的Pipeline,标准模式依赖浅层视觉响应极快,Pro模式则进行深度推理和工具使用 [58][59][61] 实际应用体验与行业影响 - **用户体验案例**:用户可用英语直接下达复杂指令(如找人代排队、呼叫无人车),助手能自主选择应用并完成操作,无需预先设置手机语言 [69][72][75] - **能力限制**:官方已主动限制部分能力,包括限制刷分、刷激励场景,部分游戏类场景,并暂时下线操作银行、互联网支付等金融类APP的能力 [68] - **行业评价**:被评价为定义了下一代AI原生手机,展现了手机从被动操作工具向能主动理解意图、独立完成任务伙伴转变的可能性 [76][85]
稚晖君5000台机器人量产下线!创业仅3年,订单数亿元
量子位· 2025-12-09 13:39
公司核心进展 - 智元机器人公司第5000台通用具身机器人正式量产下线,创始人彭志辉(稚晖君)在创业不到三年内即实现此量产规模 [1][5] - 公司已形成三大产品线,累计下线5000台机器人,具体包括:远征A1/A2系列1742台、灵犀X1/X2系列1846台、精灵G1/G2系列1412台 [13] 产品线与技术特点 - **远征系列(全尺寸人形机器人)**:身高175cm(A2型号169cm),体重69kg,自由度超过40个,定位工业制造与交互服务,搭载ActionGPT动作大模型,可根据语音指令生成上百种仿人自然动作 [14] - **灵犀系列(半尺寸人形机器人)**:累计下线1846台,为出货量最高系列,X2型号身高约1.31米,体重35-39公斤,拥有25至30个主动自由度,集成运动、交互和作业智能模块,具备自主导航、避障和自动补能功能,旗舰版搭载激光雷达和RGB-D相机,主要面向家庭陪伴、文娱商演 [16] - **精灵系列(轮式具身机器人)**:累计下线1412台,采用轮式底盘以提高稳定性和工业适用性,G2型号采用100%车规级零部件,防护等级IP42,具备亚毫米级力控装配精度,拥有三自由度腰部结构,主要面向工业智造、物流分拣、数据采集训练 [20] 商业化落地与订单情况 - **工业制造领域**:在汽车零部件企业富临精工工厂部署近百台远征A2-W轮式机器人,覆盖15个上料点,单班次可完成近万次搬箱动作,承接超500台产能的原材料配送,该订单价值数千万元,为国内首个工业具身机器人规模化商业签单案例 [23] - **3C电子领域**:与全球智能产品ODM头部企业龙旗科技达成数亿元合作,精灵G2机器人投入平板电脑组装产线执行毫米级精密操作,并首次应用“真机强化学习”技术,将新技能训练部署周期从数周锐减至数十分钟 [25] - **汽车电子领域**:获得均胜电子过亿元订单,精灵G2投入汽车安全带锁芯生产流程;在奇瑞汽车供应链企业,精灵G1承担料箱转移和物料分拣工作 [27] - **讲解接待领域**:中标中国移动7800万元全尺寸人形双足机器人采购项目,预计部署200台远征A2至各省公司展厅或营业厅,为国内人形机器人领域已披露的最大单笔采购订单之一 [29] - **品牌营销与文娱领域**:与百事可乐合作推出人形机器人代言人“百事蓝宝”;远征A2机器人“小玖”作为非人类合伙人参与湖南卫视综艺《中餐厅·非洲创业季》,承担翻译、助手等角色 [31][32] 行业量产进度与竞争格局 - 有机构预测2025年中国人形机器人商用销售出货量约5000台,而智元一家公司目前已达到此目标,显示行业量产进度快于预期 [7][8] - 2026年成为具身智能量产元年的可能性增大 [9] - 国内对比:宇树未披露产量,优必选截至今年11月交付约200台人形机器人,智元处于行业前排 [10] - 海外对比:Figure公布年产能1.2万台,计划4年内提升至10万台;特斯拉Optimus虽宣称今年产量目标近1万台,但机构调研显示实际生产进度明显不及预期 [11][12]
摩尔线程新一代GPU架构10天后发布
量子位· 2025-12-09 13:39
大会概况 - 摩尔线程将于2025年12月19日至20日在北京中关村国际创新中心举办首届MUSA开发者大会(MDC 2025)[1] - 大会是国内首个聚焦全功能GPU的开发者盛会,核心理念为“创造、链接、汇聚”[1] - 大会旨在汇聚全球AI与GPU领域开发者及产业人士,共同探索国产算力突破路径与自主计算生态建设[1] 核心议程与发布 - 主论坛将聚焦“智能算力”,公司创始人兼CEO张建中将首次系统阐述以MUSA为核心的全栈发展战略与未来愿景[2] - 主论坛将重磅发布新一代GPU架构,并推出涵盖产品体系、核心技术及行业解决方案的完整布局[2] - 公司将分享在AI计算、图形渲染、科学计算及多场景融合中的落地实践、生态进展与前瞻思考[3] 技术专题与生态建设 - 大会设立超过20场技术分论坛,议题覆盖智能计算、图形计算、科学计算、AI基础设施、端侧智能、具身智能、开发者工具与平台等关键领域[4] - 大会将设立“摩尔学院”,通过体系化的技术共享、资源整合与人才培养,共同构建国产GPU应用生态[5] 现场展示与互动体验 - 大会将联合生态伙伴打造超过1000平方米的沉浸式“MUSA嘉年华”展区[6] - 展区内容覆盖AI大模型&Agent、具身智能、科学计算、空间智能等前沿技术,并延伸至工业智造、数字孪生、数字文娱、智慧医疗等应用场景[6] - 现场将通过互动性Live Demo展示技术,具体体验包括具身智能(如机械臂/机器狗/机器人)、数字人实时交互与3D建模、国产GPU游戏、AI开发零距离体验等[7][9][11][13] 行业应用赋能 - 大会将展示全功能GPU如何深度赋能千行百业[14] - 具体展示的行业应用场景包括智慧农业、工业智造、智慧教育、智慧医疗、智慧出行、专业视觉、互联网及运营商等[16]
明天!量子位的这件大事就要来了|MEET2026
量子位· 2025-12-09 13:39
大会核心信息 - MEET2026智能未来大会将于2025年12月10日在北京金茂万丽酒店举办 [24][37][39][56] - 大会主题为“共生无界,智启未来”,关注AI技术如何穿透产业、学科与场景边界 [39] - 大会将发布《2025年度AI十大趋势报告》与《2025人工智能年度榜单》 [35][39][54] 嘉宾阵容与背景 - 大会累计邀请近三十位重量级嘉宾,覆盖学术界、产业界与前沿创业一线 [17] - 学术界嘉宾包括清华大学张亚勤院士、孙茂松教授、智源研究院王仲远院长、交大高金朱宁教授等 [1][17] - 产业界阵容覆盖芯片、云、模型到终端的全栈力量,包括百度、小米、商汤、中关村科金、高通、亚马逊云科技、谷歌云、昆仑万维、潞晨科技、PPIO等代表性企业 [1][21] - 参会的新生力量企业包括卓世科技、太初元碁、RockAI、自变量机器人、光轮智能、云徙科技、灵心巧手等 [28] 核心议题与议程亮点 - 大会议题涵盖大语言模型、多模态、具身智能、自动驾驶、云计算及具体应用等AI主流方向 [3] - 设置“重磅GenAI对话”与“前沿Agent圆桌”两场高浓度对话,探讨真问题 [5][7] - GenAI Talk由文远知行创始人兼CEO韩旭对话量子位总编辑李根,探讨GenAI赋能自动驾驶及Robotaxi大规模商业化落地 [8][11][12] - Agent圆桌主题为“距离AI Agent革新千行百业还有多久”,汇聚小宿科技、联汇科技、蚂蚁百宝箱的平台方、技术方与应用方嘉宾,探讨Agent技术架构与应用落地 [13][16][50] - 上午议程包括人工智能+趋势、AI打造超级智能体、AI从数字世界迈向物理世界、混合AI、Agentic AI未来已来等主题演讲 [41] - 下午议程涵盖多模态与智能体、AI基础设施、AI操作系统层、大模型赋能千行百业、国产算力生态、硬件觉醒、物理世界基础模型、具身智能平台等主题演讲与圆桌讨论 [45][48][50] 大会影响力与参与价值 - MEET系列大会是业界最具代表性的年度智能商业峰会之一,每年获数千万媒体曝光,吸引千位线下观众与超300万名在线观众 [36] - 参会观众质量极高,不乏企业管理层等高精尖人才,是绝佳的交流机会 [31] - 嘉宾阵容构成从理论、平台、应用到终端的完整AI落地拼图,专注解决现实问题而非空谈AGI [33] - 通过一线实践者的分享,有望找到AI从炒作走向产生实际影响的真实路径 [34]