Workflow
AI 2.0
icon
搜索文档
AI教父李开复开年信里到底讲了啥
搜狐财经· 2026-01-09 10:23
行业宏观趋势 - 2025年是AI行业的“重塑”之年,对大模型初创企业而言既是最坏的时代也是最好的时代[1] - 基座模型赛道已形成巨头寡头竞争,初创公司生存空间日趋逼仄[1] - AI 2.0正加速产业智能化转型,技术已深入田间地头与工厂车间[1] - 企业的关注点正从“是否投资AI”切实转向“如何用好AI”[1] AI技术发展核心动力 - “推理AI智能体元年”的到来是行业转变的核心动力[1] - 智能体已从机械执行指令的工具,转变为能够理解任务、自主规划并交付完整成果的生产力单元[1] - 智能体正从原子层面重塑生产力:单智能体实现具体任务智能化,多智能体可将企业顶尖人才的专业能力封装为可复用、可组合的业务资产[1] - 多智能体技术能突破传统“招聘-培养-流失”的人才循环限制,让中小企业获得与行业巨头同台竞技的“弹性能力”[1] 2026年行业展望 - 2026年将是中国企业多智能体“上岗”元年[2] - 智能体将从工具层级升维为“AI团队”,实现从“一人一工具”到“一人一团队”的跨越[2] - 人与AI的边界将被重新划分:AI接管可计算、高频重复的执行性工作,人类专注于战略决策、创新创造与情感连接[2] - 将形成高效的“数字闭环”——AI优化业务产生新数据,数据持续反哺并驱动模型进化,形成自我强化的效率提升循环[2] - 这不仅是一次技术升级,更是对组织形态的根本性重构,未来的企业将是“人类架构师”与“智能体集群”协同共进的超级智能体[2] 全球竞争格局与中国路径 - AI竞赛已进入中美双雄时代[4] - 美国倾向于打造闭源生态以争夺技术制高点,中国则坚定拥抱开源与实用主义路径[4] - 以DeepSeek、通义千问为代表的中国顶尖开源模型,凭借卓越性能、开放性和本地部署优势,推动了基础模型的“平权”[4] - 中国门类齐全的产业体系与超大规模市场,正协同推动其从“世界工厂”向“智能体工厂”跃迁[4] - 强大的开源基座模型与千行百业的真实场景之间,依然存在明显的“断层”[4] 公司战略与市场定位 - 零一万物公司的使命是打造AI 2.0时代的“大模型操作系统”,以弥合基座模型与真实场景之间的断层[4] - 其战略犹如在强大的“内核”之上,构建起完整的操作系统与丰富的工具生态[4] - 2025年,公司实现了数倍于以往的营收增长[4] - 公司目标是通过领先的产品、快速的市场拓展与健康的商业生态,打破AI 1.0时代难以盈利的魔咒[4] - 公司愿景是让每一家企业都能平等、便捷地享受技术发展的红利[4] 行业价值主张 - 真正的行业担当并非追逐排行榜上的虚名,而是让技术红利普惠千行百业[5] - 用中国自研的“大模型操作系统”助推产业升级,在中美竞合的新时代背景下具有深刻的现实与战略意义[5] - AI 2.0将以比想象更务实、更深刻的方式改变世界[5] - 在这条长坡厚雪的赛道上,唯有脚踏实地、坚定前行,方能真正实现“让AI发挥作用”的愿景[5]
收购XConn将补全内存池化核心拼图 富国银行维持迈威尔科技(MRVL.US)“增持”评级
智通财经网· 2026-01-07 15:01
公司交易与财务影响 - 迈威尔科技拟以5.4亿美元收购XConn,交易支付方式为60%现金与40%股票 [1] - 此次收购被认为对内存池化技术至关重要,并有望在近期提升公司收益 [1] - 预计被收购业务将从本财年下半年开始贡献收入,到2028财年贡献额可能高达1亿美元,并将有助于提升2027财年的收益 [1] 技术战略与行业定位 - 收购进一步证明了内存池化技术在高性能硬件解决方案中的重要性,特别是在支持更大AI模型、更大上下文窗口及提升推理性能方面 [1] - 迈威尔科技有能力将其CXL内存扩展控制器与XConn的CXL交换机结合起来,形成协同解决方案 [1] - 在AI 2.0时代,算力发展的核心矛盾已从“算得不够快”演变为“数据搬运跟不上” [2] - CXL技术是从底层物理架构对传统计算模型的一次革新,通过内存解耦、容量扩展与通信协同三个方向提升AI算力 [2] - CXL技术通过资源池化、容量解耦与一致性通信,将碎片化的数据中心重构为协同工作的整体,是实现超大规模、高性能AI基础设施的必经之路 [2] - CXL是AI算力从“单体性能竞赛”转向“集群效能博弈”的关键技术底座 [2]
这里还有8个“Manus”:1亿美元ARR,都是ToC
量子位· 2026-01-03 18:00
文章核心观点 - 文章围绕“1亿美元ARR俱乐部”展开,指出达到这一年度经常性收入门槛是AI初创公司获得市场认可的重要标志,并揭示了当前AI 2.0时代的一个显著趋势:成功的、高估值的AI应用公司正从面向企业(ToB)转向面向消费者(ToC)[9] - 这些成功的ToC AI应用公司已衍生出五条清晰的商业化路径,它们通过解决特定用户需求获得了稳定的付费用户群体,证明了其商业模式的初步成功[6][11] - 在AI-Native时代,由于存在持续的推理成本,公司的商业模式(即如何让收入增长跑赢成本增长)比技术或功能本身更能构成其护城河[40][47][51] - 对于Meta等巨头而言,收购像Manus这样已达成1亿美元ARR的成熟AI应用,比内部复制更为经济高效,因为这直接获得了经过市场验证的产品、清晰的付费逻辑、粘性用户以及关键的人才团队[58][62][66][67] “1亿美元ARR俱乐部”成员与估值 - 俱乐部成员包括Perplexity、ElevenLabs、Lovable、Replit、Suno、Gamma、Character、Manus、HeyGen等知名AI初创公司[1][7] - 这些公司的估值从数亿到数百亿美元不等,具体为:Perplexity(200亿美元)、ElevenLabs(66亿美元)、Lovable(66亿美元)、Replit(30亿美元+)、Suno(25亿美元)、Gamma(21亿美元)、Character(10亿美元+)、Manus(5亿美元)、HeyGen(5亿美元+)[7] 五类主要商业路径 - **AI搜索/信息服务**:以Perplexity为代表,通过AI搜索引擎重构信息获取方式,于2024年3月宣布ARR突破1亿美元[12][13][14] - **音频/语音基础能力产品**:以ElevenLabs为代表,走AI基础设施路线,为其他应用提供语音引擎,截至2024年9月ARR已超过2亿美元,预计年底达3亿美元[15][16] - **Vibe Coding/开发工具**:以Replit和Lovable为代表,降低开发门槛,让非技术用户参与其中。Replit于2024年6月宣布ARR破1亿美元,较2023年底的1000万美元增长10倍;Lovable于2024年7月ARR破1亿,11月更新至2亿美元[17][18] - **内容/办公效率工具**:以Gamma为代表,专注于PPT、文档等办公场景,于2024年11月宣布ARR突破1亿美元,并完成6800万美元B轮融资[20][21][22] - **生成式娱乐内容**:以Suno和HeyGen为代表,专注于音乐和视频生成以拓宽娱乐边界。Suno于2024年10月达成1亿美元ARR;HeyGen于2024年10月首次达到1亿美元ARR[23][24][25][26] ToC模式成为主导的原因与机制 - 所有“1亿美元ARR俱乐部”成员均为面向消费者(ToC)的公司,这与许多人认为企业服务(ToB)更容易获得大收入的直觉相悖[29][30] - 在AI 2.0的早期阶段,用户对产品有较高容忍度,且乐于为持续迭代带来的新体验付费[32][33] - ToC模式能让团队快速获得用户反馈,高速试错和调整,在行业高速不确定期,“快”本身就是一种优势[36][37][38] - 资本市场、媒体和用户都更青睐ToC产品出现爆款的故事,这为ToC初创公司创造了有利的外部环境[53] AI-Native应用的商业模式挑战与护城河 - AI原生应用与传统互联网应用不同,其每次响应、生成或多轮对话都会产生持续的推理成本,边际成本不会趋近于零[41][44][45] - 用户增长越快,调用越频繁,算力成本(账单)会迅速膨胀[46] - 公司必须尽早确保用户带来的价值增量能跑赢token和算力的消耗速度,否则规模增长可能导致收入增长但盈利困难的尴尬局面[47][48] - 可行的路径包括:提高客单价以覆盖单次推理成本并为迭代留出空间;或优化推理链路,将“多轮、重推理”压缩为“少轮、轻推理”,以降低单位收入的算力消耗[49][50] - 因此,在AI-Native领域,能够平衡成本与收入的商业模式,可能比技术或功能本身更能构成公司的护城河[51] 巨头收购的逻辑:以Meta收购Manus为例 - 达到1亿美元ARR证明AI产品已阶段性站稳脚跟,拥有了不完全依赖短期热度的内生增长动力[56][57] - 对于Meta而言,内部复制一个类似Manus的应用并不划算,因为AI迭代速度极快,复制期间目标公司可能已取得新的进展,且会错过争夺用户心智的关键窗口期[58][59][60][61] - 收购使Meta能够以相对合理的价格(Manus估值5亿美元,低于Perplexity等),直接获得一个经过市场验证的、拥有清晰付费逻辑和粘性用户的成熟AI付费业务[62][65] - 收购不仅获得了产品,更关键的是获得了能做好AI应用的人才团队,例如Manus创始人被任命为Meta副总裁,负责整合其Agent能力并推动商业化[66][67] - 这种收购实现了优势互补:Meta提供平台、触达能力和流量;被收购公司提供产品、付费模式和用户洞察[63][64]
维他动力创始人余轶南:60人团队一年量产机器狗,如何舍九取一踩准AI 2.0爆发点?
混沌学园· 2025-12-29 18:58
文章核心观点 - 维他动力公司抓住AI 2.0时代的历史性机遇,通过系统性的三维分析框架(用户、技术、产品),在具身智能赛道中选择了“舍九取一”的聚焦战略,成功推出全球首款无需遥控的消费级四足机器狗Vbot,瞄准了家庭户外陪伴这一高潜力、低竞争的精准市场点位[5][12][25][29][62][67] 行业背景与时代机遇 - 当前正处在AI 2.0时代的高速发展爆发阶段,产业增速极高,几乎所有投资项目都与“AI+”相关[12] - 一项原理级技术的突破会催生全新产业浪潮,AI作为底层技术将深度重构互联网、软硬件及线下实体等各个领域[12] - 具身智能迎来历史性机遇,驱动因素包括:行业成熟(电力、算力、算法)、技术突破(AI走向多模态)、市场需求(劳动力人口占比走低,服务消费需求增长)[14][24] - 电力、算力、算法三条增长曲线叠加,以十年为周期,整个行业正以几千倍乃至上万倍的速度进步[18] - 电池能量密度用10年时间提高了一倍左右,电动汽车续航从百余公里突破至千公里级别[15] - 全球最先进半导体制程已逼近3纳米[15] - 根据基准测试,每100天AI算法性能提高一倍,新模型性能媲美此前顶尖模型,所需算力仅需一半[16] - 中国人口老龄化加速,65岁以上群体对居家服务需求呈指数级增长,55%的年轻消费群体更倾向于“付费省时”[23] 公司战略与决策框架 - 面对庞大产业,公司采用三维空间分析框架来找到精准切入点:用户维度(场景)、技术路径(现状与未来)、产品定义(连接技术与场景的桥梁)[28][29] - 真正的挑战来自“该做什么”与“先做什么”的战略抉择,而非“能不能”的技术问题[26] - 创业方向的抉择需整合用户、技术、产品等多个维度,并结合自身资源条件,找到最适合的“小立方体”切入点[29] 市场选择与定位 - 在用户场景划分上,公司选择了市场规模最大、产业升级需求最迫切的消费端,而非工业或服务业[31] - 在消费端内部,进一步选择室外开放场景,因其数据多样性更复杂,对未来发展AGI能力更有助益[32][34] - 通过市场分析发现,机器人应用目前集中在教育、巡检、物流、制造业及娱乐(商演)等领域[43] - 公司建立了以“价值属性”(从娱乐到功能)和“用户类型”(从ToB到ToC)为核心的分析框架,发现功能性强且面向个人消费者的市场区域几乎完全空白[44] - 基于此,公司瞄准了空白地带,并重点评估了四足、家用机械臂、人形三种机器人形态,最终选择了四足机器狗[44][46] 产品定义与技术路径 - 产品Vbot超能机器狗是全球首款无需遥控的消费级具身智能产品,能自主完成全场景随行、载物、跟拍等能力[4][5] - 在技术选择上,公司瞄准原理已获验证、工程化路径初步显现但尚未完全成熟的“中间地带”,以规避过长商业化周期和红海竞争[36] - 选择四足形态基于多方面考量:硬件技术成熟度处于“中间点位”,软件算法基础良好,供应链相对成熟,成本可控[48] - 四足机器狗具有良好的户外移动与承载能力,能高度适配家庭户外场景(如散步、露营、购物)的运动、负重及交互需求[48] - 通过调研,约40%的孩子希望家里的机器狗扮演“哥哥”的角色,因此公司将产品形象明确为“家庭中的小哥哥”,核心价值定位为温暖、安全、好玩、勇敢[50][51] - 产品功能定位为孩子的“小跟班”(背包负重、一键跟随拍照)和家长的“小看护”(内置48小时DVR系统)[51] 竞争策略与执行逻辑 - 公司采取错位竞争策略,选择了当前竞争者很少的细分方向,即功能性强且面向个人消费者的家庭户外陪伴机器人[58] - 执行逻辑是单点击穿:在广阔的机器人行业中坚定选择C端市场;在C端中聚焦户外场景;在户外形态中选择更接近宠物形态、家庭接受度更高的四足;在产品定位上定义为“家庭成员”而非单纯的工具或玩具[60][62] - 公司成立仅一年,团队60人,通过极致的聚焦和所有人目标一致朝向“用户满意度”这一个点击穿,实现了产品从战略抉择到量产面市的全流程突破[6][66]
特斯联创始人兼首席执行官艾渝荣获第十四届金融界“金智奖”杰出创新企业家
搜狐财经· 2025-12-26 19:38
会议与奖项概况 - 金融界于12月26日在北京主办“启航·2025金融峰会”,主题为“新开局、新动能、新征程”,汇聚了监管部门、行业协会、金融机构、上市公司等数百位相关领导和嘉宾 [1] - 峰会期间揭晓了第十四届“金智奖”年度评选结果,特斯联创始人兼首席执行官艾渝获评“杰出创新企业家” [1] 奖项评选标准与范围 - “金智奖”评选紧密契合“十五五”规划中“提升上市公司质量”的要求,从社会责任、实业贡献、投资回报、成长前景、创新效率、杰出品牌六大维度评估企业高质量发展 [3] - 评选以企业财务数据和公开信息为基础建立量化模型,覆盖A股、港股及中概股超8000家企业,最终评选出近200家获奖企业 [3] 获奖者个人与公司成就 - 艾渝获评“杰出创新企业家”,源于其带领特斯联在科技创新、价值落地、社会责任等多维度展现出的创新精神和卓越领导才能 [3] - 特斯联是我国AIoT领域的开拓者与领导者,在艾渝引领下紧跟AI 2.0时代浪潮,将AIoT互联能力延伸至智算基础设施与智能体领域 [4] - 公司近期发布了“异构算力超节点”与“全新智能体”等核心产品,并宣布战略升级,明确以算力基础设施与智能体为双核心,构建“算力支撑智能体、智能体反哺算力”的良性循环 [4] - 特斯联从技术研发到产业落地,持续扩大全球科技影响力,赢得了行业与资本市场的双重认可 [4] 奖项意义与行业影响 - “金智奖”旨在树立高质量发展标杆,激励上市公司聚焦主业、深耕创新、践行社会责任,推动资本要素向优质企业集聚 [4] - 奖项为“十五五”时期实体经济与资本市场协同发展凝聚行业共识,艾渝的获奖不仅是对其个人创新领导力的认可,更彰显了资本市场对企业价值的肯定 [4]
对话范浩强:10亿融资之前,我们手搓了5000元“丐版硬件”
量子位· 2025-11-21 17:00
公司成立与融资进展 - 公司于2025年3月正式成立,创始团队来自旷视等AI企业,具备AI 1.0时代的实战经验[5][6][18] - 成立9个月内完成3轮融资,近期获得阿里巴巴独家投资的A+轮融资,金额达数亿元[4] - 公司目前规模为百余人,融资节奏快但强调执行不因资本而变形[59][60] 技术方向与产品定位 - 公司聚焦具身智能领域,从To B工业场景切入,优先落地物流行业的拣选分发等高频环节[20][21] - 核心产品基于自研端到端多模态具身智能大模型MMLA,搭配双抓夹机械臂,实现非结构化物品的抓取与分类[21][22] - 产品已在上海等地仓库完成POC(概念验证),具备基础交付能力[22][23] 硬件研发标准 - 工业级执行体需满足三大指标:无故障时间1万小时、按年为单位升级、主力型号每年迭代一代[27][31] - 因科研机无故障时间仅百小时或千小时,无法满足生产要求,公司选择自研硬件[28] - 专业硬件团队已组建,计划明年发布新一代配合移动平台的具身版本[28] 开源战略与生态建设 - 公司开源具身智能链条三件套:Dexbotic(脚本化实验流程)、DOS-W1(模块化数据采集机器人)、Robochallenge(真机评测平台)[38][39][41][44] - Robochallenge平台联合抱抱脸等机构,吸引智源研究院、清华大学等数十家高校及企业参与,并于11月20日成立组委会[44][47] - 开源目的包括降低行业门槛、展示技术实力、促进合作,并计划明年开源具身智能基座模型[49][50][55][58] 行业认知与发展策略 - 公司认为具身智能技术成熟需十年长周期,参考AI 1.0时代人脸识别从实验室到城市级应用的经验[63][65] - 当前市场处于早期阶段,客户多为观望态度,公司强调长期信心与短期耐心,拒绝追求短期上市或收购的节奏[60][65][68] - 团队注重系统工程能力,主张在核心环节追求可控性,并通过开源构建行业基础设施[32][37][50]
“离职风暴”后迎来新高管团队,零一万物欲重振To B商业化
观察者网· 2025-10-29 17:59
公司战略调整 - 公司于2025年3月迅速将战略从To C优先调整为To B优先 [2] - 公司正式公布“To B 2.0”阶段核心高管阵容,目标是通过市场与销售、模型与技术、国际与咨询三维合力加速“All in To B”战略 [1] - 公司战略核心为“一把手工程”,强调企业AI转型必须由CEO亲自参与战略设计,将AI深度嵌入核心流程 [1] 高管团队变动 - 2025年5月,公司多位核心创始成员相继离职,包括联合创始人谷雪梅和联合创始人、技术副总裁戴宗宏,创始团队近乎“分崩离析” [1][2] - 新高管团队由新加盟的联合创始人沈鹏飞、内部晋升的AI模型副总裁赵斌强和国际业务副总裁宁宁组成 [1][3][5] - 联合创始人沈鹏飞拥有26年IT与互联网经验,曾任百度智能云中国区副总经理,带领团队签约并交付“六十亿级”项目 [3] 技术与产品进展 - AI模型副总裁赵斌强主导自研模型的数据工程和全链路训练管线,负责大模型核心算法研发、专业Agent应用开发以及出海专业用户生产力产品线 [3] - 其领导的Pop Ai产品已成为公司To P出海关键产品,在全球专业用户中实现规模化增长 [4] - 公司自研的万智企业大模型平台已具备完整技术栈,覆盖数据、算法、训练、安全的全链条能力,并于今年7月正式升级至万智2.0版 [6] 市场与业务拓展 - 万智平台已覆盖政务、金融、工业、办公等五大行业,部署超过30类“超级员工”AI Agent,实现企业AI能力的批量化复制 [6] - 国际业务副总裁宁宁负责全球业务拓展及AI咨询体系建设,推动多个“一带一路”国家级主权模型项目 [5] - 公司开创“前线部署工程师”机制,将技术与咨询嵌入客户核心业务 [5]
顶级阵容集结|李开复出席GOTC 2025主论坛,定义生成式AI下一站
搜狐财经· 2025-10-28 11:02
活动信息 - GOTC 2025全球开源技术峰会将于11月1日至2日在北京举行 [1] - 峰会宗旨为连接全球开源与AI生态、链接未来生产力 [4] 核心演讲嘉宾 - 零一万物CEO、创新工场董事长李开复博士将出席主论坛并发表演讲 [1] - 演讲主题为《生成式AI:从ChatBot到Agent的跃进与机会》 [1] 演讲核心观点 - 生成式AI驱动的AI 2.0革命正以前所未有的速度推进 [3] - AI Agent的颠覆式创新将重构商业流程与价值创造 [3] - 从ChatBot向自主决策的推理Agent跃迁孕育全新机遇 [3] 公司动态与发布 - 零一万物是一家致力于打造全球领先AI 2.0大语言模型平台及行业应用的公司 [3] - 公司已迅速成为大模型赛道的独角兽企业 [3] - 峰会期间零一万物将携手开源中国发布“Open Agent Kit平台” [4] - 该平台旨在为企业提供智能体解决方案,支持对接多种开源大模型 [4]
泡沫还是机遇?如何参与“AI 2.0”时代的科技股行情?
新浪财经· 2025-10-24 18:11
财报季与市场关注点 - 特斯拉和IBM已于美东时间10月22日公布三季度财报,英特尔将于10月23日发布业绩 [1] - 科技巨头财报发布使市场目光聚焦于科技股未来走势 [1] - 过去6个月全球多个科技指数涨幅超过20%,创业板涨幅接近60%领跑 [1] 全球科技股估值分化 - 恒生科技指数估值最为温和,具备一定安全边际 [4] - A股创业板指因市场情绪推动,估值已升至41.9倍,接近美股水平 [4] - 纳斯达克指数在“七巨头”拉动下,市盈率约达43.5倍,领跑全球 [4] - 欧洲斯托克600科技板块估值仍显著低于美国市场 [4] - 估值分化反映各地区科技产业竞争力差异及对AI技术商业化进程的不同预期 [6] 资金流向与市场结构 - 尽管部分资金开始关注估值较低的欧洲和亚洲科技股,但美国科技股仍是全球资本聚集地 [6] - 资金高度集中于人工智能、半导体等前沿领域 [6] 当前市场与2000年互联网泡沫对比 - 当前科技股市场由扎实的业绩增长(如AI算力)驱动,而2000年由投机情绪主导且缺乏盈利支撑 [7] - “七巨头”占标普500市值约30%,市场集中度高 [7] - 当前英伟达、微软等巨头盈利强劲,而2000年多数公司亏损 [7] - 当前AI技术步入商业化落地阶段,而2000年处于互联网普及初期 [7] 市场潜在风险 - “七巨头”总市值约占标普500指数的30%,集中度接近或超过2000年科技股巅峰水平 [7] - 市场表现高度依赖少数公司,一旦其业绩不及预期可能引发市场整体回调 [7] 投资配置策略 - 投资者应采取均衡的多国别多策略配置,避免过度集中 [8] - 可通过投资科技主题的FOF产品间接布局一篮子科技企业,分散风险 [8] - 可考虑配置估值相对合理的亚太或欧洲科技股,以对冲美股回调风险 [8] - 科技股长期成长逻辑坚实,但短期需关注估值压力和结构性风险 [8]
无问芯穹发起人汪玉:Token已成为智能时代最核心的生产要素之一
IPO早知道· 2025-09-01 10:14
文章核心观点 - 人工智能基础设施效能评价核心指标正从"每焦耳能量支持的计算次数(TOPS/J)"转变为"每焦耳能量处理的有效Token数量(Tokens/J)"[3] - Token已成为大模型时代最核心的生产要素之一 是AI模型输入输出的基础单元[3][5] - 软硬件协同优化是提升单位能耗下Token效率的关键路径 需从芯片设计、互联技术到集群架构全面优化[3][9][11] AI基础设施效能评价体系变革 - AI 1.0时代芯片评价标准为每焦耳TOPS AI 2.0时代转变为每焦耳Tokens/J[6] - 不同智能等级对Tokens/J能效需求差异显著:Level 2差1-2个数量级 Level 3差2-3个数量级[7] - 高质量Tokens/J需持续演进 从简单对话到AI for Science需确保大模型推理性能不受影响[7] 神经网络优化技术路径 - 通过稀疏化优化矩阵运算:零元数量可从50%增加到75% 稀疏模式从非结构化发展到结构化稀疏[9] - 量化技术从32比特浮点发展到FP8、FP4 国产芯片正逐步支持更高效数据表示[10] - 神经网络可学习特性支持算法与硬件协同优化 在保证精度前提下减少计算开销[9] 算力系统架构演进 - 算力集群构建需经历晶圆级集成、芯片互联、服务器互联、集群整合的逐级集成过程[11] - 系统优化分三个层级:小盒子(计算优化)、中盒子(芯片间协同)、大盒子(万卡级资源调度)[12] - 万卡至十万卡规模需解决系统稳定性、容错管理和任务正确性等关键问题[12] 端侧与云侧能效挑战 - 端侧应用需求与现实能力存在10倍差距 需实现20 Tokens/J能效和100-200 Tokens/s推理速度[12][15] - 云侧正从能效角度推进优化 提升每节点Tokens/J实现可持续计算[12] - 2025 WAIC已展示峰值200 Tokens/s的端侧方案[12] 智能体演进带来的系统挑战 - 从单模型到多智能体协作时 GPU利用率降低、动态性增强、开销增大[14] - 多智能体面临并行性、上下文处理、工具复杂度等挑战 需系统级工具支持[14] - 具身智能推动研究重心从云侧芯片向端侧推理演进 是智能系统迈向物理世界的关键[15] 产业生态建设 - 需优化多元异构生态 从基础设施层、模型层到应用层做联合优化[13] - 算力集群已覆盖北京、上海等多省市 服务主要算力消耗方[14] - 正积极适配各类端侧芯片 服务联想等合作伙伴 推动AI云能力赋能千行百业[15]