Workflow
雷峰网
icon
搜索文档
钉钉疯人院,跑出三个爆款
雷峰网· 2025-12-24 08:22
文章核心观点 - 钉钉在创始人无招回归后,正通过投入巨资、重构底层技术和产品,进行彻底的自我革命,以告别移动互联网时代,全面步入AI原生时代 [4][6][7] - 公司通过发布三款爆品(DingTalk A1、AI表格、AI听记)及全球首个为AI打造的工作智能操作系统Agent OS,展示了其以AI逻辑重塑产品与生态的决心 [6][16][39] - 真正的产品创新需要系统级、产业级的重构,钉钉的布局旨在成为AI时代产业链协同的枢纽,推动全球办公产业的AI变革 [39][40][42] 产品创新与战略转向 - 钉钉团队文化“钉钉疯人院”回归,强调以偏执的热情与极致的产品追求投入AI时代的产品创新 [7] - 公司调集十亿级资源对钉钉进行AI改造,决心彻底告别上个移动互联网时代 [4][7] - 产品创新的核心目的是从底层架构到产品形态进行彻底重构,实现真正的AI原生,而非浮于表层的功能叠加 [42][43] 爆品一:DingTalk A1 - DingTalk A1是一款AI录音卡片硬件,发布后迅速在抖音、天猫等平台成为销量榜首,成为AI时代阿里最成功的硬件之一 [10][17] - 产品成功关键在于精准解决用户痛点:改用通用Type-C接口;每月提供1300分钟免费转录时长(含钉钉自带300分钟) [14] - 公司投入几十亿元升级语音识别系统至Transformer架构,并为每种方言投入高达几千万元人民币进行单独训练,以提升准确率 [15] - 背靠阿里千问自研大模型,通过规模效应降低边际成本,使其售价及后续会员费远低于依赖第三方大模型的同类产品 [16] - 该硬件核心作用是为钉钉在手机上增设“AI键”,旨在连接物理世界的声音与信息,未来将实现一键调用Agent的能力 [34][36][37] 爆品二:AI听记 - AI听记(原钉钉闪记)在无招回归后几乎被重做一遍,团队投入十几亿元从头搭建语音大模型 [22] - 团队整合阿里云和夸克的力量,投入一亿小时的训练,仅半年训练成本(不算GPU)就达几十亿元 [22] - 巨大的投入使钉钉听记的语音识别准确率从80%多提升至97%-98% [22][23] - 产品增加了带时间戳的一键摘取等实用功能,并结合钉钉海量用户数据形成自我增强的产品闭环 [24] 爆品三:AI表格 - AI表格是无招回归后第一个明确投入的产品,团队保持“每天小迭代、3周一个大迭代”的节奏 [26][30] - 公司认为表格更贴近B端和生产端,是中小企业主决定采用协同软件的关键,因此将产品定位从“多维表”改为“AI表格”,旨在成为“AI时代的Excel”和“AI时代的应用搭建平台” [27][28][31] - 团队借力阿里数据库优势,4个多月推出产品,并成为业内首个真实落地单表千万行、首个实现真实可用表格AI的产品 [30] - 产品注重易用性,早期找保洁阿姨、保安大叔等中老年人内部测试,确保无障碍使用,后在制造业、农业生产中获广泛好评 [30] - 在AI钉钉1.1发布会上,AI表格新增“随口说”语音交互、“万能贴”数据整理等功能,并升级了仪表盘和“AI应用”模式 [30] 操作系统与生态布局 - 钉钉发布了全球首个为AI打造的工作智能操作系统——Agent OS [6] - 公司正从单品爆款和操作系统两个层面,构建Agent OS生态闭环,其核心逻辑是通过底层打通,实现一键调用各个Agent的能力 [38][39] - 钉钉的创新布局延续产业变革逻辑,旨在将AI技术、硬件制造和办公场景深度绑定,成为产业链协同的“枢纽” [40] 行业趋势与产品哲学 - 办公工具的AI革命已从“选择项”变为“必答题”,其核心逻辑始终是将人从低效重复劳动中解放出来 [42][43] - 真正的破局需要从底层架构进行彻底重构,敢于“杀死”过去的自己 [42] - 历史规律表明,爆款产品是产业链变革的“点火器”,例如IBM PC奠定了个人计算机时代格局,iPhone重塑了消费电子供应链并催生App生态 [39] - 产品创新的目的是让技术服务于人,让每个普通人都能掌控AI时代的生产力 [43]
阿里无人车的「阵痛史」:团队赛马、战略摇摆与整合困局
雷峰网· 2025-12-23 22:30
无人物流车行业近期动态 - 2023年以来,无人物流车赛道迎来资本与落地双重利好,行业玩家历经多年蛰伏后触底反弹,赛道驶入跑马圈地、加速扩张的快车道 [3] - 2023年10月,新石器完成了自动驾驶领域最大的一笔私募投资,九识智能、白犀牛也纷纷宣布完成新一轮数亿元融资 [3] - 有消息称,九识智能已经拿到中国邮政近10亿元投资,且九识智能、新石器、白犀牛三家公司都在筹备上市,试图抢占“无人物流车第一股” [3] - 近日有消息称菜鸟无人车或将卖给九识智能,双方还在就交易细节进行洽谈,收购的最大收益或是“拿下申通”这一快递物流领域的大客户 [3] 阿里无人车发展历程与核心团队 - 阿里无人车的故事始于菜鸟,终于菜鸟 [5] - 2018年,菜鸟引入原阿里YunOS总裁张春晖牵头成立无人车事业部,搭建起以技术负责人陈俊波、运营负责人谷祖林为核心的团队,正式将无人车纳入菜鸟业务发展体系 [14] - 同年,阿里成立达摩院,并组建“自动驾驶实验室”投入自动驾驶研究,技术路线为L4全自动驾驶并应用于乘用车,由阿里副总裁王刚带队 [15] - 自此,阿里内部形成了“双线并行”的格局:菜鸟ET物流实验室研发低速无人物流车,达摩院自动驾驶实验室主攻无人乘用车 [15] 菜鸟无人车早期发展与技术路径 - 菜鸟ET物流实验室的成立源于2016年推出的“菜鸟小G”无人驾驶物流机器人,它也是后来达摩院“小蛮驴”的雏形 [9][13] - 技术负责人陈俊波是阿里内部公认“最早想做自动驾驶的人”,他于2015年认定物流是自动驾驶最佳应用场景,并留在阿里内部创业 [10][12] - 空降负责人张春晖认为无人车的“大脑”得自己做,“眼睛”等硬件找外部供应商,为此联动菜鸟投资部于2018年10月战略投资激光雷达公司速腾聚创超过3亿元 [19] - 早期速腾聚创的激光雷达订单中,菜鸟无人车的采购占比接近八成 [19] - 张春晖为菜鸟无人车规划了从无人物流小车到无人重卡、无人轻卡的发展路径,并提出了“驼峰计划”与“公路高铁”车队概念 [20][21] 团队合并与首次整合 - 2019年9月至2020年4月,集团将菜鸟ET物流实验室一百多人悉数并入达摩院自动驾驶实验室,组成了约300人的新团队 [21][29] - 此次合并由达摩院院长行癫和菜鸟CEO万霖共同牵头,万霖希望将机器人等智能研发业务放在菜鸟之外以控制成本 [30] - 合并导致菜鸟无人车运营负责人谷祖林离职创业,团队负责人张春晖转任斑马网络联席CEO [21][32] - 达摩院自动驾驶实验室在2018年底已将战略重点从Robotaxi转向园区低速无人车,与菜鸟团队方向“殊途同归” [29] 达摩院时期的发展与内部挑战 - 团队合并后,于2020年云栖大会发布了第一款无人物流车“小蛮驴” [35] - 2021年,小蛮驴配送订单达到100万单,王刚称三年后车队规模将达到1万辆 [37] - 2021年起,为促进阿里云商业化,达摩院实行独立核算制并制定了10亿元KPI,导致预算减少 [38] - 2021年9月,阿里领投L4自动驾驶公司元戎启行3亿美元B轮融资,其中阿里投资2亿多美元,此事动摇了军心,导致包括地图定位负责人张硕在内的早期成员大批出走 [38] - 内部成员对比,美团无人车每年投入5-10亿元,而达摩院自动驾驶实验室一年预算不到3-6亿元,集团投资外部团队的资金是内部团队的数倍,引发不满 [39] - 集团投资元戎启行是出于风险对冲考虑,因为自动驾驶实验室进展不如想象中快,此举也导致团队放弃了Robotaxi的探索 [40] 领导层变动与战略摇摆 - 2021年一次关于达摩院未来方向的“P9会议”上,逍遥子与行癫发生重大分歧,逍遥子主张基础科研,行癫主张应用研究,此后行癫“隐身”,达摩院进入2.0时代且发展方向不明 [41][43] - 2022年年初,王刚因高校市场增长潜力见顶、开放路段技术能力不足导致规模化商用遥遥无期而离职创业 [45] - 王刚离职后,自动驾驶实验室一号位空缺,集团空降CTO程立(鲁肃)管理,技术负责人陈俊波与产品负责人郭振宇因风格和思维差异存在诸多分歧 [45][47] - 2022年8月,陈俊波提出做无人卡车“大蛮驴”,逍遥子非常支持并承诺3年投入100亿元,项目开展后团队从约200人扩至300人 [49] - 2022年年底,项目开展半年多后,核心算法负责人陈俊波出走,直接导致团队分崩离析,两个月后实验室解散 [50] - 逍遥子曾为挽留陈俊波召开全员会议,提及“一年给你五个亿做大蛮驴”的承诺,但未能成功 [51] 业务终局:回归菜鸟 - 2022年秋天,达摩院想将小蛮驴卖给菜鸟但被拒绝,此时小蛮驴累计送货已超2000多万个包裹,日常运营车队接近1000台,而美团、京东的无人车都还不到百万级,美团车队仅200多台 [52] - 2023年阿里启动“1+6+N”组织变革后,达摩院最终以0对价将自动驾驶实验室股权转让给菜鸟,“小蛮驴”业务和部分人员转入菜鸟,“大蛮驴”项目夭折 [53] - 产品负责人郭振宇选择离职创业,小蛮驴进入菜鸟体系后由菜鸟CTO在宽负责 [53][54]
独家丨长城哈弗将采用Momenta智驾方案,新车计划明年初上市
雷峰网· 2025-12-23 22:30
Momenta获得长城汽车新车型定点 - Momenta已获得长城汽车旗下两款新车型的定点,其中一款为哈弗猛龙车型,搭载Momenta方案的长城新车型预计将于明年初上市 [2] - 新车型的辅助驾驶能力定位在L2+级别,支持高速NOA和泊车辅助功能,暂不支持城市NOA [2] Momenta的技术方案与产品路线 - 新车型将搭载Momenta最新的一段式端到端方案,采用与别克至境L7相同的R6飞轮大模型 [2] - 该方案将基于高通骁龙8620芯片开发,有效算力达156TOPS [2] - Momenta接下来的量产方案将全面转向一段式端到端,并陆续全面引入基于强化学习的大模型 [5] - 基于强化学习的一段式端到端R6飞轮大模型已于2025年8月18日首次在别克至境L7车型上实现量产搭载,提供城市NOA等功能 [5] - Momenta CEO曹旭东表示,该飞轮大模型能够在模拟环境中探索新驾驶行为,自我快速成长,其驾驶能力有机会超过甚至大幅度超过人类 [5] Momenta与长城汽车的合作关系 - Momenta以客户为中心,为服务长城汽车,曾在长城总部所在地保定设立专门的辅助驾驶Demo测试团队,CEO曹旭东多次到场督导,并定期向长城智能化负责人姜海鹏进行技术演示 [7] 长城汽车的辅助驾驶供应商格局 - 长城汽车目前的辅助驾驶方案供应商还包括元戎启行 [7] - 2024年8月,搭载元戎启行无图城市NOA方案的长城魏牌蓝山智驾版上市 [7] - 2024年11月,元戎启行官宣获得长城汽车的1亿美元融资 [7] - 随后,长城坦克500、魏牌高山等车型陆续切换至元戎启行的辅助驾驶方案 [7] - 截至2025年11月,搭载元戎启行城市NOA方案的量产车辆已达20万辆 [7]
付昊桓教授:超智融合赋能地球模拟,洞见未来气候轨迹丨GAIR 2025
雷峰网· 2025-12-23 14:31
文章核心观点 - 超算性能的突破与人工智能的深度融合,正推动全球气象预报从“风云莫测”走向“变幻可测”,实现更高时空分辨率的模拟与预测 [2] - 数值计算与人工智能的深度融合是超算领域的核心发展方向,旨在从根本上改变理解和预测复杂地球系统及其他科学领域的能力 [92] - 超算与智算(AI计算)的思维模式高度相似,都需聚合最强算力以实现技术突破,并高度依赖自动化工具、性能、效率、规模与稳定性 [4][89] 超算在地球系统模拟中的应用与重要性 - 超算的传统使命是用整机资源解决单一核心问题,地球系统模拟是其经典应用,因为科学家无法在真实地球上进行实验,必须构建数字孪生模型来研究气候变化、防灾减灾等重大问题 [9] - 地球系统模式对于支撑全球气候变化研究、国际气候谈判以及可持续发展具有重要意义 [9] - 国产超算系统(如神威系列)性能的增长,支撑了地球系统模式时空分辨率的显著提高,例如已实现在约1公里分辨率下达到接近“模拟一年,耗时一天”的速度 [4][66] - 提升模式时空分辨率(例如目标将深圳气象模式提升至100米)和利用AI方法融合海量观测数据,是降低模型不确定性的两大方向 [11] 国产超算的发展历程与成就 - 神威系列超级计算机实现了从依赖国外架构到全国产化的跨越:神威·蓝光是第一台完全采用国产处理器的超算;神威·太湖之光则是首台凭借全国产处理器获得世界第一的超算,也是全球首台峰值性能超过100 Pflops(十亿亿次浮点运算/秒)、并行规模达一千万核的机器 [17][18] - 在神威·太湖之光上,团队开发了200多个可扩展到百万核并行的应用,以及50余项可充分利用整机的新应用,涵盖地球系统模拟、工业仿真、生物医药、量子计算等多个领域 [20][21][22] - 神威超算系列有10余项应用入围国际高性能计算最高奖“戈登·贝尔”奖,其中3项获奖 [21] - 基于神威·太湖之光,团队生产了全球首套约750年的高分辨率气候模拟数据供国际使用 [45] 超算与AI融合面临的挑战 - 挑战一:时空分辨率提升带来算力需求的指数级增长,同时超算架构正从同构多核向GPU等异构架构变革,如何解决复杂模型与新机器架构的适配问题是一大挑战 [11][13] - 挑战二:如何利用AI方法高效融合千余颗卫星产生的海量多源观测数据 [11][14] - 挑战三:科学计算程序复杂(如百万行代码),移植、优化与重构工作艰巨,且需要程序能在全机规模稳定运行数月,对系统稳定性要求极高 [27][29] - 挑战四:交叉型人才匮乏,既懂特定科学领域(如气象)又懂高性能计算(HPC)的人才稀缺,且这类人才容易被大模型公司挖走 [29][74] 技术进展与突破 - 通过代码重构、优化及针对国产处理器架构的重新设计,成功将复杂的地球系统模式移植到神威超算上,并实现了高效扩展 [27][33][37] - 采用“非侵入式的代码并行化方案”等自动化工具,大幅提升了移植和优化效率,例如在2023年的一次移植探索中,仅用三周就将代码性能从每天模拟约5天提升到每天模拟半年(在全球5公里大气、3公里海洋分辨率下) [50][52] - 2024年,通过引入AI能力,实现了AI增强的全球1公里分辨率“无缝隙天气气候模式”,可同时用于短时天气和长期气候研究 [52] - 在神威·海洋之光(太湖之光架构的演进)上,进一步探索公里级模拟,其处理器核组数从4个增至6个,存储和计算性能得到提升 [47][48] - 最新工作集成了大气、海洋模拟与AI能力,开发了“AI驱动的高性能便携式地球系统模型”,并入围2024年戈登·贝尔奖气候建模类别最终提名 [69] 未来展望与重点项目 - 国家超算深圳中心二期即将上线,其计算性能实现巨大飞跃:预期Linpack持续测试性能达到双精度2 EFlops(两百亿亿次浮点运算/秒),单精度4 EFlops,若换算为INT 8计算,整机可支持32 EFlops,理论峰值约40 EFlops [76][79] - 深圳超算二期(传统超算)将与鹏城云脑三期(AI超算)背靠背放置并通过高速光纤互联,这种大规模传统超算与AI超算相连的模式在全世界可能也属首例 [76] - 计划在深圳超算二期上尝试构建千万核可扩展的、公里级的中国区域海陆气候模式预测系统,核心目标之一是解决汛期降水预报的难题 [84][85] - 计划在深圳推进构建“国产新一代数值智能双驱动大湾区百米级气象预报系统”,包括百米级高精度数值模拟、AI辅助的集合预报与数据同化技术 [87] 行业生态与供需思考 - 超算与AI算力的发展逻辑相似,都需要通过高速互联形成庞大计算资源以求解复杂问题,并需要高度并行可扩展的算法及匹配的模型复杂度 [72] - 与AI领域相比,科学计算领域存在代码复杂、并行难度高、演进缓慢、公开数据集少、软件生态不完善、人才培养周期长等挑战 [74] - 当前算力投入需关注软硬件协同,国产算力生态(特别是基础框架软件)的投入相对硬件投入可能不足,需要更多资源来建设,类似英伟达CUDA生态的长期投入 [95] - 从科研从业人员角度看,算力可能仍然不足,但从产业发展角度的供需情况难以准确判断 [96]
电商税落地背后:执行迷雾、进退失据
雷峰网· 2025-12-23 14:31
文章核心观点 - 中国税务监管政策(特别是“电商税”相关)的严格执行,正对跨境电商行业产生深远且剧烈的冲击,行业面临从“野蛮生长”向“合规经营”的强制性转型,短期阵痛显著但长期将促进行业洗牌和良性发展 [3][29][31][32] 成本利润之困:卖家的众生相 - 电商税作为新增刚性成本,放大了行业原有的利润压力,不同规模卖家感受差异巨大:大卖家尚可承受,中腰部卖家最为艰难,小卖家或因规模暂时未被重点监管 [7] - 中腰部卖家利润微薄,加税可能导致亏损:例如月销售额50万人民币的卖家,回款仅约15万,尚未扣除进货和物流成本;产品毛利仅20%、净利率不足10%的卖家,若加征13%的增值税将导致亏本 [7] - 市场反应出现分化:部分卖家视其为清理市场、建立公平竞争环境的长期利好,尤其对已建立规范体系和品牌溢价的卖家而言;但多数中小卖家面临的是生存危机 [8][9] - 卖家采取三种主要生存策略应对成本压力:将成本转移至消费者端而涨价、自行消化成本以维持原价、或继续低价竞争以规模熬死对手 [9][10] 合规之困:交税难倒大批卖家 - 核心难点在于如何实现并证明“合规”,当前缺乏明确可操作的政策指引,完全按文件执行可能导致对跨境电商的“一刀切” [13] - 两大关键合规障碍:一是大量真实采购无法取得进项发票,无票部分可能被视同利润征收25%企业所得税,例如3000万元无票采购或产生750万元额外税款;二是“买单出口”模式可能被认定为内销,需补缴增值税,对年销售额超500万的卖家税率从1%跳至13%,足以吞噬全年利润 [14][15] - 店铺主体与经营主体割裂造成申报困境:大量店铺为借用他人资料注册,将收入申报至店铺公司会引发法人风险、资金管控和未来资本化路径受阻等多重问题 [16] - 主流报税模式存在风险:“赛维模式”(通过香港主体代运营并完税)因缺乏本地实际运营而可能不被多地税务局认可;中小卖家直接将销售额报至店铺公司则易被认定为拆分规模以规避税负 [16] - 平台规则与税务规则存在根本矛盾:平台要求店铺间严格隔离以防关联,而税务要求“业务、资金、发票、合同、物流”五流合一,导致卖家在合规成本与操作可行性上陷入两难 [16] - 现实操作成本高昂:例如,为匹配每天成千上万订单的出入库凭证需额外人力,对薄利生意难以承担;为多个主体分别进行采购和开票在现实中几乎无法运转 [17] - 当前可行的生存策略是争取增值税免征认定,并尽力补齐成本凭证与进项发票以控制应税利润,否则只能接受利润被吞噬或关停业务 [17][18] 行业之变:未来将走向何处? - 卖家寄望于9810(跨境电商出口海外仓)模式以实现增值税免征,但其存在结构性风险:难以证明多店铺运营下的货权归属,且出口退税逻辑与业务节奏存在错配,报关金额难以确定 [20][21] - 监管尝试探索新路径:如深圳等地对年销售额500万元以下的跨境电商试行“核定征收”,按固定征收率计税以降低合规门槛,释放规范与包容并存的信号 [22][23] - 监管压力传导至平台,促使平台账单系统更清晰(如Temu),但平台数据报送仅是监管入口,旨在为税务系统提供可自动比对、追溯的底层数据源 [24] - 未来监管压力将持续:明年1月税务部门将收到今年第四季度(通常是销售旺季)的平台数据,更多卖家将进入有效监测范围;明年3月31日前企业所得税汇算清缴时,系统将全面比对全年数据,对无票采购、未报关或通过第三方工具转移利润的行为风险显著上升 [25][26] - 监管底层逻辑已变:金税四期上线打通了电商平台、银行、支付机构等多维数据接口,实现了从“以票管税”到“以数治税”的转变,使电商税具备可执行性,大幅压缩隐形操作空间 [29][30][31] - 行业长期走向清晰:合规成为入场券,缺乏长期打算的投机者将逐步退出,市场将更有利于在产品、服务和创新上投入的长期主义者 [31][32]
国产GPU账本:神秘的「赎回负债」,壁仞科技亏损背后的秘密?
雷峰网· 2025-12-23 08:34
公司财务表现与亏损分析 - 壁仞科技收入增长强劲,从2022年的49.9万元人民币增至2023年的6203万元,2024年进一步增至3.37亿元,年复合增长率达2500% [3][15] - 公司报告期内亏损巨大,2022年、2023年、2024年及2025年上半年分别亏损14.74亿元、17.44亿元、15.38亿元和16亿元 [4] - 巨额亏损主要源于按国际财务报告准则确认的“赎回负债”账面值变动,该科目在2022至2025年上半年间分别产生34.8亿元、60.4亿元、67.4亿元及101.1亿元的账面损失,三年半累计达263.7亿元 [4][9] - 剔除赎回负债影响后,公司三年半的实际经营亏损为37.20亿元,与A股同行公司亏损水平相当,属于行业正常范围 [10] 赎回负债的财务解读 - “赎回负债”或“可转换可赎回优先股”是一种混合金融工具,在港股国际财务报告准则下被列为金融负债,其账面价值随公司估值上升而增加 [4][5] - 赎回负债造成的巨额账面亏损不反映公司实际经营能力,对现金流无影响,公司上市后该负债将转换为普通股权益而消失 [6] - 赎回负债的账面值变动反而反映了公司估值的上涨,数字越大通常意味着公司估值越高 [7] - 类似情况在港股科技公司中常见,如小米集团2017年账面亏损439亿元中有541亿元源于此科目,但经调整后净利润为53.6亿元;美团2017年账面亏损189.88亿元中亦有151.39亿元源于此 [12] 经营能力与调整后指标 - 更能代表公司实际经营能力的指标是“经调整后净亏损”,该指标剔除了赎回负债、股份薪酬等非现金、非经营项目的影响 [11][13] - 壁仞科技经调整后的净亏损从2023年的10.5亿元大幅收窄至2024年的7.7亿元,显示经营状况在改善 [13] 行业背景与公司前景 - GPU是芯片行业中研发投入高、商业周期长的“烧钱”赛道,阶段性亏损是国产GPU企业的共性特征和必要的“成长成本” [15] - 公司产品竞争力与集群建设能力得到市场认可,截至2025年12月15日,拥有总价值约12.41亿元的5份框架销售协议及24份销售合约 [15] - 公司产品路线图清晰,计划推出基于第二代架构的BR20X系列数据中心芯片,预计2026年商业化;下一代BR30X/BR31X系列预计2028年上市 [16] - 行业有望持续受益于算力芯片国产化趋势,呈现百花齐放态势 [16]
上海AI Lab王靖博:人形机器人,从「盲动」走向「感知驱动」丨GAIR 2025
雷峰网· 2025-12-23 08:34
文章核心观点 人形机器人控制正从依赖力反馈的“盲走盲动”阶段,迈向融合环境感知的“感知驱动”新阶段,通过创新的感知方案、统一的行为基础模型以及高效的Sim2Real迁移技术,旨在实现机器人在复杂非结构化环境中的长程、通用且稳定的自主运动与交互能力[3][4][44] 人形机器人研究的必要性与价值 - 研究人形机器人具备天然通用性,因为现实生活环境围绕人类需求搭建[3][9] - 互联网上存在海量源于人类日常生活的第一人称和第三人称数据,为模型训练提供了丰富的运动与操作逻辑资源[3][9] - 相关研究(如交互逻辑与安全性)最终将回馈到人类自身,例如提升自动驾驶等领域的人机交互安全[3][9] 核心挑战:Sim2Real迁移与感知融合 - 人形机器人研究的核心问题之一是如何在仿真中训练并使其技能稳定迁移到真实世界,即跨越Sim2Real鸿沟[3][10] - 控制策略转向“感知驱动”是必然趋势,需要融合视觉、激光雷达等感知以实现复杂环境中的自主导航与交互[4] - 实现带感知的局部运动需解决四大问题:环境构建、感知方案选择、环境表征形式、以及与运动策略的联合训练[17] 创新的感知与环境表征方案 - 团队摒弃了RGB相机(存在光照纹理差异、缺乏几何信息)和深度相机(仿真数据过于干净、存在噪声鸿沟)等传统方案[14][15] - 最终采用激光雷达,并将点云转化为体素形式进行环境表征,以压缩信息、去除冗余并提升效率[15][18] - 在仿真中创新性地引入了机器人本体的激光雷达自扫描功能,以更好地对齐仿真与真实的传感器数据分布,显著缩小了Sim2Real鸿沟[3][20][21] 感知驱动的运动控制优势 - 新方案使机器人能提前感知地形变化(如台阶、吊顶)并预先规划动作,而非依赖碰撞后的力反馈,提升了安全性与预判性[3][22][25] - 改装后的机器人拥有足够大的视场角,能实现全向运动,并支持多种地形的训练,实现全地形运动能力[20] - 该方案的Sim2Real表现非常一致,仿真中的策略研究能可信地迁移到真实世界[28] 构建通用的行为基础模型 - 为实现机器人技能的通用性,需要建模一个“行为隐变量”,使机器人能根据环境或任务选择不同隐变量,灵活组合技能[28][29] - 团队选择打造“任务感知型”机器人,其隐变量直接参与任务决策,可实现快速迁移,无需额外训练高层控制器[31] - 构建过程分为四步:数据重构、训练代理智能体、设计控制模式与掩码、以及通过师生学习框架实现Sim2Real迁移[32] 模型能力与实验验证 - 模型不仅能完成基础运动跟踪,还能响应姿态与运动指令,并支持全身遥操作和复杂动作(如原地起立)[33] - 隐变量分析显示其具备结构化特征,不同运动对应的隐变量特征区分明显,且可通过线性组合完成复合动作(如回旋踢)[33][34] - 在对比实验中,该方法比任务专用模型抗过拟合能力更强,比不带隐变量的方法跟踪精度更高[34] 交互任务的拓展与技能组合 - 针对交互任务数据稀缺、精度要求高的特点,采用生成式模仿学习框架,用运动先验约束合理性并融入任务奖励[35] - 通过分离式任务头设计、构建大规模多样化仿真环境、以及设计专属任务掩码,训练出通用的感知编码器[36] - 提出高效技能组合方法论,通过复用技能表征、引入专用地形感知、调用通用本体感知器及动作适配,使机器人能完成如复杂地形中搬运箱子的复合任务[38][39] 未来发展方向 - 行业正从“盲走盲跳”的纯运动演示阶段,迈向“感知驱动”的新阶段[44] - 未来突破可能在于采用离线监督学习的方法,收集足够多数据以构建参数量更大的模型(向GPT级别靠拢),从而赋予机器人更长程的控制能力[4][47] - “规模化扩展”是重要方向,但当前在线强化学习方式与板载算力限制制约了用超大模型探索更多技能与控制形式[47]
快手直播间出现大量涉黄内容,快手回应:遭到黑灰产攻击;吉利汽车宣布完成极氪私有化;Waymo无人车闯祸了!路口集体趴窝导致堵车
雷峰网· 2025-12-23 08:34
自动驾驶与Robotaxi - Waymo数十辆自动驾驶出租车因旧金山大范围停电导致红绿灯失灵而集体在十字路口停滞,造成交通拥堵,有乘客被困车内数十分钟[4] - 此次停电由太平洋燃气电力公司变电站火灾引发,波及约13万用户,覆盖旧金山约30%区域[4] - Waymo解释其系统设计为在信号灯失效时按四路停车规则通行,但此次停电规模过大导致车辆确认路口状态时间过长[4][5] - 特斯拉借机宣传其FSD系统,发布视频显示其Robotaxi能在无红绿灯路口自主执行四路停车规则,并称其系统已在数十亿英里现实世界里程中训练[5] - 特斯拉目前在湾区运行的Robotaxi仍配备安全员[5] AI硬件与可穿戴设备 - 小米系创业公司光帆科技将发布全球首款搭载摄像头的AI耳机,产品集成视觉摄像头与多模态感知,定价预计在2000元档位[8] - 光帆科技成立于2024年10月,由前小米自研手机及汽车OS负责人董红光创办,公司近期完成多轮融资,估值将增长至10亿元[8] - 产品亮点为自研的AgentOS及摄像头的环境感知功能,适配场景包括AI选餐厅、提醒日程等,旨在不依赖手机完成点外卖、订机票等日常需求[8] - 公司内部认为最佳穿戴式AI产品需离耳朵和眼睛更近,且需有成熟的消费者心智教育,因此选择先做AI耳机[9] 中国科技公司人事与组织调整 - 百度MEG进行新一轮调整,技术研发由副总裁赵世奇负责,用户侧产运由副总裁李小婉负责,搜索相关业务已合并统一管理[13][14] - 前字节跳动Seed大模型视觉基础研究团队负责人冯佳时已加盟腾讯,担任腾讯AGI研究中心多模态团队负责人[18] - 冯佳时于2019年加入字节,曾被部分媒体誉为字节大模型“关键8人”之一,并曾为张一鸣提供一对一AI辅导[18] 消费电子与手机行业动态 - 小米总裁卢伟冰确认小米17 Ultra将涨价,且涨幅会“有点多”,主要原因是2025-2027年为内存成本上涨期,内存价格猛涨导致手机成本大幅上升[21] - 小米17 Ultra厚度为8.29mm,较前代减薄11.3%,为小米Ultra史上最薄,起售价将高于前代小米15 Ultra的6499元[21] - 荣耀高管林林表示整个电子行业成本趋势非常恶劣且将持续至少一两年,手机涨价不可避免,甚至已发布产品也可能突破原价,二手手机也可能涨价[32] - 华为发布nova 15系列,其中Ultra和Pro版搭载麒麟9010S芯片,标准版搭载麒麟8020,整机性能较上代nova 14 Ultra提升18%,起售价2699元[34][35] 企业资本运作与私有化 - 吉利汽车宣布已完成对极氪的私有化,极氪现为其间接全资附属公司,财务业绩将并入集团报表,极氪已从纽交所退市[14][15] - 高性能电动汽车品牌极星获得吉利瑞典控股集团提供的6亿美元贷款额度以维持运营,其中最后3亿美元需根据流动性需求获得同意[31] - 极星2025年销量有所回升,但财务状况仍面临挑战,公司旗下共有四款车型在28个国家销售[31] AI与机器人产业融资与发展 - 智元机器人创始人邓泰华透露,公司今年有望实现5000台机器人出货,销售收入有望超过10亿元,预计明年起出货量与收入将保持数倍增长[33] - 智元机器人发布第三方租赁平台“擎天租”,预计机器人租赁市场规模今年已突破10亿元,明年规模不低于100亿元[33] - 诺亦腾机器人完成Pre-A+轮融资,累计募集资金达数亿元人民币,本轮由启明创投领投,资金将用于具身智能多模态数据研发与规模化数据生产体系建设[29] - 诺亦腾机器人是一家面向具身智能与人形机器人产业的数据公司,以提供高质量训练数据为核心[29] 互联网平台与内容治理 - 快手平台多个直播间出现大量色情内容,平台回应称遭到黑灰产攻击,已紧急处理并报警,异常行为疑似与东南亚黑产团队有关[10] - 山姆App部分商品评论区用户实拍图片在被点开时饱和度会自动提高,与未点开原图存在明显差异,山姆客服称此为8月上线的测试功能,处于长期测试优化阶段[27] 国际科技巨头与AI竞赛 - 微软CEO纳德拉亲自抓AI产品,每周与约100名核心技术人员开会,反复追问进展并施压负责人,对消费级Copilot与邮箱连接功能表现不满[41] - 纳德拉加大AI人才招聘参与力度,亲自联系候选人并批准高竞争力薪酬方案,以从OpenAI和谷歌DeepMind挖角[42] - OpenAI CEO奥特曼称公司将保持每年1-2次的“红色警报”紧急状态,每次持续6到8周,以应对竞争威胁[44][46] - 近期“红色警报”由谷歌Gemini 3和中国厂商DeepSeek的技术表现触发,OpenAI为此集中精力发布了GPT-5.2模型[45][46] 芯片与半导体产业 - 英伟达获美国联邦贸易委员会批准,将对英特尔进行50亿美元战略投资,获得近4%股权,双方将共同开发基于x86架构的定制化CPU并与GPU深度集成[49] - 此次投资被视为将NVLink标准嵌入x86生态的关键一步,可能影响AMD及ARM生态的竞争格局[51] - 为应对存储芯片剧烈涨价,一家全球头部PC厂商(推测为联想或惠普)高管密集拜访三星、SK海力士、美光等供应商并达成供货保障协议[46][47] - 联想集团最新季度PC业务全球市场占有率达25.5%,惠普为19.8%[47] 汽车产业与海外市场 - 德国铁路公司向比亚迪订购200辆电动巴士,作为其总价值超10亿欧元的3300辆巴士采购计划的一部分,车辆将在比亚迪匈牙利工厂生产[47][48] - 德国财政部长对此表示不满,希望订单交给德国或欧洲制造商,此举被中方专家批评为贸易保护主义[48] - 保时捷中国回应将自2026年3月1日起有序裁撤自建的“保时捷尊享充电”服务设施,转向与第三方头部充电运营商合作,目前自建充电站约有200家[43] 企业薪酬与职场趋势 - 比亚迪确认对技术研发人员实施专项涨薪,覆盖全岗位序列,最高单次调薪幅度达3000元,部分项目组平均调薪幅度超20%[12] - 比亚迪技术岗每年有两次晋升窗口,晋升后薪资涨幅普遍在10%-15%,叠加本次调薪,资深工程师年收入增幅可超30%[12] - 智联招聘报告显示,国内8.4%的公司已正式推行“强制下班”制度,78%职场人会因内卷环境而跳槽[23] 其他行业要闻 - 影石创新旗下影翎Antigravity全景无人机上市2周内,网络上出现超过2500条虚假恶意内容,公司已报案并最高悬赏10万元征集线索[24][25] - 意大利竞争与市场管理局因滥用市场支配地位对苹果公司处以9863.5万欧元罚款,约合8.1亿元人民币,苹果表示将上诉[43][44] - 阿里千问发布“2025十大AI提示词”榜单,“股票”排名榜首,阿里巴巴已成立千问C端事业群,目标将其打造成AI时代用户第一入口[38]
独家丨OpenAI、Meta都在押注的摄像头AI耳机,被这家中国明星创业公司抢先发布
雷峰网· 2025-12-22 13:52
公司概况与产品发布 - 光帆科技是一家成立于2024年10月的AI创业公司,由前小米自研手机及汽车OS负责人董红光离职创办,公司主打面向下一代人机交互的AI可穿戴硬件及通用AI Agent [1] - 公司成立约一年,近期连续完成多轮融资,估值已迈进“10亿元俱乐部” [1][3] - 公司将于近期正式发布其首款AI硬件产品,即全球首个搭载摄像头的AI耳机,此举将抢先OpenAI、苹果、Meta等巨头 [1][13] - 公司团队规模目前大约100人,其中包括原MiniMax的C端技术负责人,其带领大模型团队承担了多项产品研发任务 [6] 产品细节与战略定位 - 即将发布的产品是一款集成视觉摄像头、具备多模态感知能力的AI智能耳机,其研发过程相对保密 [3] - 产品亮点包括自研的AgentOS操作系统,以及摄像头在“环境感知”中的关键作用 [6] - 该AI耳机的系统适配场景广泛,包括AI选餐厅、提醒日程、点外卖、订机票等,旨在覆盖日常生活和办公场景,无需借助手机即可实现需求 [6] - 关于产品定价,公司尚未对外透露,但业内人士基于成本和生态位考量,预测会在2000元人民币档位 [5][6] - AI耳机被公司视为一个起点,未来或将深度融合环境感知与多设备联动技术,为用户提供即时、主动、情境感知的AI服务体验 [3][4] 行业竞争格局与品类选择 - 当前AI可穿戴硬件领域竞争激烈,传统大厂与创业公司已进入短兵相接阶段 [8] - 行业内在AI眼镜和AI耳机两个品类上存在方向之争 [9] - AI眼镜方面,谷歌、苹果等硅谷巨头以及阿里巴巴夸克均在加码,但面临佩戴接受度、重量、产品质量等挑战 [9][10] - AI耳机作为当前所有可穿戴设备中体量最大、消费者心智成熟、并能更快实现AI落地的设备,正成为一个新的探索方向 [10] - 字节于2024年10月发布了首款AI智能体耳机Ola friend,但其AI运算依赖连接手机App,并非独立设备 [10] - 包括OpenAI、Meta在内的众多顶尖公司,以及国内某互联网大厂,都在押注搭载摄像头的AI耳机方向 [11][17] - 光帆科技内部经过讨论后形成共识,认为最好的穿戴式AI产品需要离耳朵、眼睛更近,同时需要有成熟的消费者心智教育和广泛的佩戴接受度,因此最终选择先做搭载摄像头的AI耳机 [12] 技术趋势与产品差异化 - 搭载摄像头的AI耳机正在成为行业共识方向,核心原因在于单纯依靠语音识别的AI耳机市场相对饱和且创新点不足 [15][16] - 当前市场上52%的AI耳机定价在千元以下,功能趋于同质化,主要围绕AI翻译场景展开 [16] - 苹果下一代AirPods、Meta正在研发的名为Camerabuds的耳机,以及国内某头部互联网大厂(代工方为歌尔)筹划的产品,都选择了搭载摄像头的方案 [17] - 搭载摄像头预示着竞争维度将从“听觉智能”迈向“多模态融合智能”的跃升 [17] - 对AI耳机而言,摄像头的作用并非拍照,而是专注于环境理解与上下文采集,采集多模态数据以实现基于自然语言的模糊需求理解和任务完成 [17] - 搭载摄像头是巨大的工程挑战,涉及降低功耗、持续调动摄像头进行环境感知、实现操作系统级流畅度等,对硬件产业链提出了系统性升级要求 [19] - 相比Meta等大厂,光帆科技团队的操作系统及硬件背景被认为是其最大优势 [20]
恒生电子首席科学家白硕:Agent之难,无关算力、模型与平台
雷峰网· 2025-12-22 13:52
文章核心观点 - 金融行业AI Agent落地的核心壁垒并非算力成本或通用平台,而在于业务接口的“厚度”,即封装了丰富业务逻辑、能理解自然语言指令的原子化服务能力 [4][8][12] - 通用Agent编排平台的价值正在弱化,其市场份额被高估,真正的竞争力在于垂直领域深厚的资源积累与丰富的原子化服务 [4][14][17] - 金融Agent的发展将走向稳态与敏态业务分离的终局,由AI中台连接,其中敏态业务由Agent负责,这依赖于深厚且贴近业务的接口体系 [5][33] Agent发展的核心壁垒与价值判断 - **接口“厚度”是关键壁垒**:构建Agent的核心挑战在于原有IT系统开放的业务接口“厚度”不足,无法让Agent理解用业务语言表达的复杂意图,导致技术与业务之间存在鸿沟 [8][10] - **“厚度”体现为丰富的原子化服务**:判断厂商接口开放“厚度”的标准,在于其能提供多少种封装良好、可通过自然语言方便调用和发现的“菜谱”式服务,而非底层的标准化编排框架 [12] - **需重视领域“黑话”治理**:垂直领域存在大量行业术语,需进行大模型友好的数据治理,使垂域数据与通用AI技术能有效对接 [9] - **预算构成中算力仍是大头**:在预算构成中,算力成本仍占主要部分,但行业对算力价格持续下降抱有信心,例如DeepSeek等模型正在冲击算力下限 [13] - **开源模型已成主流**:在以私有化部署为主的金融领域,开源大模型(如千问)已广泛应用,付费私有化部署模型竞争力不强,Llama等模型的时代已经过去 [13] 金融Agent的发展路径与现状 - **发展历经三阶段**:从硬编码自动化,到通过“拖拉拽”图形界面配置流程的半自动化,再到当前利用自然语言描述步骤并自动映射资源能力的阶段 [19][20] - **当前阶段依赖ReAct模式调试**:当前AI无法保证流程拆解完全正确,需通过ReAct模式进行动态修改和回滚,确保系统操作可逆,避免不可逆的错误改变 [21] - **金融机构需求从单域走向平台化**:2023-2024年,金融机构的Agent构建多集中在单一业务域;2025年,开始出现平台化需求,旨在共享底层算力与模型资源,实现跨系统数据拉通与业务创新 [22][23] - **实施采用“边用边备”策略**:业务适配的“厚度”积累是长线任务,金融机构倾向于从简单场景入手,通过实现短期目标来逐步推进接口开放与优化,而非一次性大量投入 [24] - **多Agent应用有其特定场景**:在一个法人机构内部,多Agent的必要性较弱,简单的串联流程可合并为一个大Agent;多Agent更适用于需要长期运行、持续探测并通知的跨机构或性质不同的任务 [29] 行业终局与厂商实践 - **终局是稳态与敏态业务分离**:未来的系统架构可能是敏态业务由Agent负责,稳态业务转变为后台的工具、资源或物料,中间由必须与垂域资源配套的AI中台进行连接 [5][33] - **通用Agent平台被高估**:脱离垂直领域深厚积累的通用Agent开发平台只是一个“空架子”,市场价值不高,其市场份额被夸大到几万亿的说法完全不正确 [4][17][35] - **幻觉问题在金融场景可控**:在用于实际“干事”的金融Agent场景中,幻觉问题(如编造接口)能够被控制,因为不存在的接口调用会失败,规划错误可通过ReAct模式修正 [25] - **恒生电子的AI落地实践**:公司AI落地包括客户侧与自身内部应用 [30] - **客户侧**:与国内头部金融机构合作,在投研、投顾、运营等场景落地专业Agent;研发基于实体地图增强的金融垂域智能体开发平台;子公司通过“语控万数”平台为Agent提供精准数据物料 [30] - **内部应用**:升级客服系统为AI自助平台「U+」;为工程实施人员提供AI知识库工具赋能;内部研发AI编程能力工具以提升效率 [30][31] - **Agent的本质是“智能地干事”**:与以往聊天或嵌入系统的copilot不同,Agent是独立存在,能够将自然语言指令作为复杂意图拆解,并调用后台不同系统、资源和数据源完成一系列动作 [32]