Workflow
Emu3.5
icon
搜索文档
AI应用下一个突破口在哪
北京商报· 2025-12-10 23:44
文章核心观点 - AI产业正从“工具时代”迈向“伙伴时代”,发展重点从上半场的想象力转向下半场的执行力 [1] - 量子位智库发布的《2025年度AI十大趋势报告》基于基础设施、模型进化、应用版图等四部分进行总结,其中应用相关趋势占四席,涉及流量入口、多模态、AI硬件和AGI [1] 基础设施与算力经济 - 算力经济是智能产业第一大引擎,全球对AI算力的需求以前所未有的速度增长,直接推动超大规模数据中心建设,这些数据中心演变为由单个AI公司主导的集成了海量计算、存储和网络资源的算力工厂 [3] - 云计算厂商的投资重点从传统通用计算资源向满足AI需求的专用算力基础设施倾斜,与AI企业的合作模式从简单资源租赁演变为深度绑定的战略合作关系 [3] - AI原生需求正在重塑芯片创新:GPU主导地位受挑战,NPU在端侧普及,ASIC/FPGA迎来增长 [3] - 中国正加速构建自主可控的算力生态,国产“芯片+SDK+框架”方案已在千亿级模型训练中得到验证,DeepSeek等模型针对昇腾芯片深度优化,标志着全栈国产化能力迈入新阶段 [3] 模型进化与创新 - 预训练决定大模型格局梯队,架构创新决定预训练水平,在算力约束下,混合专家模型(“大参数、小激活”)成为主流选择,中国头部模型团队普遍采用这一思路 [4] - 2025年大模型落地进入“推理时间”,模型在多模态深度推理、自适应推理、边缘推理加速等方面持续突破,任务复杂度推动推理框架持续进化 [4] - 物理AI与具身智能迎来研发热潮,世界模型与VLA(视觉—语言—动作)框架成为技术焦点,具身智能正从小规模商业订单走向更广泛的应用探索 [4] - 智源研究院发布的多模态模型Emu3.5是世界模型的基座,人工智能正从语言学习进入多模态、世界学习的新阶段 [5] - 自变量机器人自主研发的“Great Wall”模型系列已实现从感知到高精度操作的端到端控制,在复杂任务中展现出强大的泛化能力 [6] 应用版图扩大 - AI正在重塑流量入口,Agent从“人找服务”转向“服务找人”,成为下一代交互范式,AI智能体具备感知、规划、决策、执行的闭环能力,正逐步取代传统App,操作系统亦向超级Agent演进 [7] - 新一代AI系统能够同时处理和理解文本、图像、声音、视频等多种信息类型,实现跨模态的关联理解和生成,为创意内容生成、智能交互等应用开辟新可能 [7] - AI应用的关键价值在于释放高价值劳动力,将人类精力转移到具有实质性价值的核心任务和战略性工作上,报告预测未来2—3年内,随着技术能力成熟,AI会成为相关产业的标准工具 [7] - AI硬件赛道受关注,轻量化模型和边缘计算技术成熟,推动AI能力向手机、汽车、IoT设备等终端普及,端侧AI解决了数据隐私、网络延迟和成本效率三大核心问题 [7] 具身智能的商业化进展 - 优必选与国内AI大模型公司签订人形机器人销售合同,总金额超过5000万元,除了提供机器人硬件,还将开放数据接口与技术能力,支持合作方将其自有AI大模型与机器人本体进行集成与二次开发 [4] - 优必选工业人形机器人Walker S2已启动量产与交付,首批数百台已投入汽车制造、智能制造、智慧物流、具身智能数据中心等产业一线应用,目前Walker S2产能每月已超过300台,预期全年交付量将超过500台 [5]
100亿都不够烧!机器人公司CEO们给出新判断:具身智能不能再照搬LLM
搜狐财经· 2025-11-22 10:41
智源研究院技术进展 - 发布原生多模态世界模型Emu3 5,训练数据从15年视频扩展至790年,参数规模从8B提升至34B,并引入自研DiDA技术使视频、图像生成速度提升至与Diffusion、DiT类模型相当 [5] - 构建跨异构本体具身智能体系,包括RoboBrain(具身大脑)、RoboOS(跨本体操作系统)与基于VLA的RoboBrain-0,已在多款不同形态机器人本体上部署,能完成导览、导购到复杂交互任务 [5] - 展示全身控制能力,宇树G1机器人在其控制框架BAAI Thor加持下完成拖动1 4吨汽车的实验 [5] 行业核心议题讨论:模型与架构 - 世界模型需从海量视频中学习,面向具身智能所需的“下一时空状态预测”,而非语言主导的“下一个Token预测”,且必须建立在大量属于机器人的数据之上 [5][7] - 具身智能未来可能需要一套“先行动、再视觉、最后语言”的具身原生结构,以行动与感知为核心,而非沿用当下“大模型的语言中心范式” [10] - 具身智能的最终“大模型”并非单体模型,而是VLA+世界模型+RL的闭环系统 [12] 行业核心议题讨论:数据来源与使用 - 机器人必须在真实场景中学习真实性、多样性和规模化,但仿真是当前更现实的突破口,许多底层控制能力如行走、跳跃等全身控制及灵巧手操作需在模拟器中完成,真实世界仅做微调 [15] - 视频数据被视为最容易大规模获取且最接近真实世界的关键数据形式,训练逻辑可类比人类从视频理解世界再到真实交互校正的过程 [15] - 真实与仿真数据会形成螺旋上升关系,先落地采集真实数据,回仿真扩大覆盖,再回真实验证,不同阶段根据任务需求使用不同类型数据 [15] 行业核心议题讨论:资源投入与硬件形态 - 若有100亿元资金推进具身智能,投入优先级集中在顶尖人才吸纳、算力与数据引擎等基础设施,以及打造属于具身智能的模型体系 [17][19][21] - 人形机器人并非具身智能的唯一最终形态,硬件瓶颈问题的核心是场景需求,模型不定义硬件,硬件也不定义模型,场景定义硬件 [22][23] - 具身智能体系应分层,上层大模型可跨本体复用,但贴近执行的小脑层模型需随硬件结构细调,同一模型部署到不同本体上未必最优 [23]
奥特曼否认OpenAI明年上市;中国移动0元划转4198万股
21世纪经济报道· 2025-11-04 11:27
巨头风向标 - OpenAI CEO否认公司计划明年上市,并透露其年收入远超传闻中的130亿美元 [2] - 中国移动集团将其持有的4198.1348万股A股股份无偿划转给中国石油集团,划转后中国移动集团持股比例从69.05%降至68.85%,中国石油集团持股0.19% [3] - 微软CEO表示公司可能在未来一年内重启招聘,前提是现有员工掌握与AI协作的新工作模式,公司现有员工21.9万人 [4] - OpenAI与亚马逊云科技达成380亿美元算力采购协议,将使用数十万块英伟达GPU,同时承诺继续向微软采购2500亿美元服务 [5] - 小鹏汽车CEO何小鹏官宣团队正全力冲刺2026年实现机器人量产,并展望未来5-10年机器人将走入更多家庭 [6] - 埃隆·马斯克宣布将推出一款全新的加密通信平台XChat,主打无广告和高隐私保护 [7] - 波音公司以105.5亿美元完成其数字航空解决方案业务部分资产的出售,交易为全现金,旨在优化资本结构并专注于核心业务 [8] 政策与标准 - 国家数据局表示在数据领域标准研制中企业占比达78%,并明确将优先支持创新能力强、掌握核心技术的民营企业牵头标准研制 [9] 芯片与半导体 - 马斯克称已与团队审核特斯拉智能辅助驾驶芯片AI 5的进度,并表示AI 6、AI 7将紧随其后推出 [10] - 高通与联发科加速布局台积电N2P工艺,台积电A16制程最快明年3月试产,苹果将于A20系列芯片中引入WMCM先进封装技术 [11] 融资与资本 - 武汉蔚能电池资产有限公司完成6.7亿元C轮股权融资,公司运营电池资产规模已突破30GWh,服务用户超40万人,并已申请专利超160项 [12] 产品与技术 - 智源研究院发布悟界Emu3.5多模态世界大模型,其参数量从8B上升至34B,视频数据训练量时长从15年跃升至790年,并通过新技术将每张图片的推理速度提升近20倍 [13]
AI伪造黄仁勋直播,观看人数超英伟达官方5倍;OpenAI计划2027年上市,估值或高达一万亿美元|一周AI要闻汇总
36氪· 2025-11-01 17:45
行业技术产品发布 - Adobe推出最先进图像生成模型Firefly Image 5,支持400万像素原生输出,并新增视频和音频生成工具,同时为Photoshop等应用推出新AI工具 [2] - 智源研究院发布Emu3.5多模态大模型,在超过10万亿token数据上训练,视频训练时长从15年跃升至790年,参数量从8B升至34B [2] - 火山引擎发布豆包视频生成模型1.0 Pro Fast,生成速度提升约3倍,价格下降72%,生成5秒720P视频仅需10秒,5秒1080P视频成本为1.03元 [5] - MiniMax发布最新音乐模型Music 2.0,在音乐理解与表达上实现飞跃,支持多种唱法和情感风格,可精准控制人声音色和乐器编曲 [6] - 谷歌旗下Google Labs推出AI营销工具Pomelli,可自动提取公司网站信息建立“商业DNA”,并生成社交媒体活动创意和视觉素材 [4] - 埃隆・马斯克推出AI驱动的百科全书“Grokipedia”早期版本,定位为维基百科的“升级版”且“更少偏见” [5] 公司战略与资本运作 - OpenAI据悉计划最早于2026年下半年提交上市申请,2027年上市,估值或高达1万亿美元,预计今年营收将增加两倍以上至127亿美元,明年增长一倍以上至294亿美元 [6] - OpenAI完成资本结构重组,非营利主体更名为OpenAI Foundation并掌控营利实体26%股份,公司当前估值约1300亿美元,微软持有32.5%股份 [9] - Figma收购AI图像与视频生成初创公司Weavy,整合为子品牌Figma Weave,标志着公司向“AI原生内容生成+编辑”生态升级 [3][6] - 英国AI视频生成独角兽Synthesia完成2亿美元融资,估值达40亿美元,由谷歌风投领投,其平台已有6万家企业用户,覆盖约70%的全球财富100强企业 [9] - AI医学生产力工具开发公司“零假设”获近亿元A轮融资,资金将用于打磨场景化AI医学智能体 [10] - 盛大创始人陈天桥宣布将投入10亿美元算力支持全球科学家的创新人工智能研究 [9] 企业运营与行业动态 - YouTube围绕AI进行重组,作为公司向AI更广泛转变的一部分,旨在提高生产效率,并向考虑离职的美国员工提供自愿离职买断方案 [3][7] - 富士康将在其休斯顿AI服务器工厂部署人形机器人,目标部署时间为2026年第一季度 [13] - 人形机器人公司1X Technologies发布家用人形机器人NEO,售价20000美元或月付499美元,具备倒垃圾、整理衣物等能力,预计2026年开始交付 [5] - Adobe将把OpenAI和谷歌的AI模型集成到Photoshop及其他工具中 [8] - 蚂蚁集团AI健康应用AQ在中国AI原生应用榜排名跃升至第7,其复合增长率达83.4%,远超行业13.5%的平均增速 [8] - 谷歌与美国能源公司合作重启一座装机容量615兆瓦的核电站,旨在为AI数据中心提供电力支持,谷歌将履行为期25年的购电协议 [8] 社会影响与监管动态 - 美国参议员提出“GUARD”法案,拟禁止18岁以下未成年人使用AI聊天机器人 [3][12] - 抖音集团副总裁表示AI会让制造谣言变得更容易,同时平台也在利用AI能力治理谣言 [12] - 澳大利亚警方正利用AI工具解码犯罪分子在加密聊天中使用的表情符号和网络俚语,以更有效地预防犯罪 [11] - 视频会议平台Zoom CEO表示,AI助手有望让人们告别“五天工作制”,其“数字分身”功能能让AI化身代替用户说话 [12] - OpenAI遭美国明星视频平台Cameo起诉,指控其Sora视频生成应用的新“Cameo”功能涉嫌商标侵权 [13]
90后数学家王虹拿下超级大奖;陈天桥将投10亿美元算力支持发现式智能;泡泡玛特中东首店开业;OpenAI回应筹备IPO丨邦早报
创业邦· 2025-10-31 08:08
胡润女企业家榜与财富动态 - 翰森制药钟慧娟以1410亿元财富首次成为中国女首富 [1] 人工智能行业动态与投融资 - OpenAI正筹备IPO,公司估值最高可能达到1万亿美元,但发言人表示IPO并非当前重点 [1][2] - 陈天桥宣布投入10亿美元算力支持发现式智能研究,旨在推动具备创造和发现能力的通用人工智能 [8] - 英伟达计划向AI公司Poolside投资至多10亿美元,此交易将使该公司估值增至原先4倍,Poolside正洽谈以120亿美元估值募集20亿美元资金 [18] - 英特尔正就收购AI芯片初创企业SambaNova Systems进行初步谈判,若达成交易估值可能低于其2021年融资轮次中获得的50亿美元估值 [18] - 强化学习即服务平台Pyromind Dynamics完成千万美元种子轮融资 [18] - AI医学生产力工具开发公司零假设完成近亿元A轮融资 [18] - 智源研究院发布悟界Emu3.5多模态世界大模型,在超过10万亿token的数据基础上训练,视频数据训练量时长从15年跃升至790年,参数量从8B上升至34B [19] - YouTube正在进行重组,着眼于AI方面的应用,作为向AI专注的更广泛转变的一部分,并向美国员工提供自愿离职买断方案 [17] 汽车与交通行业 - 零跑汽车高级副总裁曹力澄清"与华为道不同不相为谋"的媒体报道为曲解,表示公司坚持核心技术全域自研与和其他企业展开合作不矛盾 [2] - 福特将在阿根廷追加投资1.7亿美元,用于生产插电式混合动力车Ranger皮卡,计划于2027年开始生产 [14] - 因安装灯条至挡风玻璃时可能使用了错误的表面底漆,导致越野灯条可能脱落,特斯拉在美国召回6197辆2024款Cybertruck [17] - 德国大众集团2025年第三季度净利润为负10.72亿欧元,前三季度净利润同比下降61.5%至34亿欧元,业绩走弱主要受低利润率的电动车产量增加及75亿欧元的额外负担影响 [18] - 滴滴送货推出"运费垫付保障",承诺若司机完成订单7天后仍未收到运费,平台将全额垫付 [10] 消费电子与智能硬件 - 小米集团大家电部总经理单联瑜回应"巨省电"系列名称争议,表示该系列国标EPF是5.0,小米一般做到5.27,并做了AI节能设计 [4] - 大疆发布轻量化智能跟拍无人机DJI Neo 2,机身重151g,系列首搭全向避障,售价1499元起 [19] - 华为推出商用智能手表华为擎云H7556,首发智感窗健康监测技术,支持eSIM独立通信 [21] - 苹果首席执行官蒂姆・库克在2025财年Q4电话会议上回避了分析师关于"iPhone Air减产"的直接提问 [13] - 2025年第三季度全球智能手机市场出货量达3.201亿台,同比增长3% [23] 电商、零售与本地生活 - 京东支付在11.11期间推出"100万份免单天天抽"活动,整个大促期间免单总量达100万份,10月30日晚有大量京东外卖用户收到约60秒的免单 [6] - 刘强东购买肯德基请京东外卖全体超15万名全职骑手就餐,京东外卖还将联合百大餐饮品牌和名人明星发起请客活动 [8] - 泡泡玛特中东地区首家门店在卡塔尔多哈哈马德国际机场开业,并首次推行7天24小时营业模式 [10] - 淘宝闪购即将上线"淘宝便利店"项目,定位24小时线上营业的精品杂货店,SKU约1万种,品类丰富度约为普通便利店3倍 [13] - 阿里巴巴旗下1688平台推出"诚信通AI版",出现一批月销超10万元的"AI原生店铺" [19] - 小红书上线"线索直播"产品功能并已在商测,该功能能在直播中直接唤起可留资的组件 [19] 企业战略与人事变动 - 巨人网络公关负责人回应前CEO离职,称公司内部实行研发运营发行一体化的赛道制,充分放权以调动积极性、提高决策效率并规避内耗 [10] - NBA批准古根海姆CEO马克・沃尔特成为洛杉矶湖人队新老板,沃尔特以100亿美元估值收购球队全部股权,此次支付约60亿美元获得多数股权,沃尔特与伯利合计持有湖人队85%股权 [13][14] 其他行业与事件 - 护肤品牌"LAN"及其母公司回应产品备案与宣传不符的质疑,称产品、原料备案合规,相关投诉已转交多地监管部门核查处理 [13] - 维基百科在向美国用户募捐的公告中暗讽马斯克的GrokiPedia,称本站由人类运营,不属于亿万富翁 [14] - 上海柘飞航空科技有限公司完成数千万元人民币天使+轮融资 [18] - 源天生物获得丰田通商(上海)有限公司战略投资,累计融资数千万元 [18]