Agentic Infra
搜索文档
Agent 正在终结云计算“流水线”,Infra 必须学会“思考” | 专访无问芯穹夏立雪
AI前线· 2025-12-02 12:28
基础设施范式转变 - 基础设施演进正从AI Infra走向Agent Infra乃至Agentic Infra,成为推动智能体规模化落地的关键力量[2] - 范式从“处理”转变为“思考”,基础设施需从“生产线工厂”转变为“解决方案公司”,为Agent的整体产出质量提供系统性支撑[3] - 基础设施需具备智能性,能够保障Agent执行任务的质量,协调连续且相互关联的多任务协作[3][4] Agent Infra 核心升级维度 - 运行环境需灵活适配Agent的执行方式,环境的沙盒化与灵活调度能力尤为关键[4] - 为Agent配备完善的工具,使其能够有效调用资源[4] - 提供精准而充分的上下文信息,确保任务理解与执行的一致性[4] - 通过安全与监控机制,保障整个任务过程的可控性与可观测性[4] Agentic Infra 的演进与目标 - Agent Infra是第一阶段,旨在让算法能力被更好地发挥,推动智能体走出实验室环境,帮助Agent从演示品走向生产力[9] - Agentic Infra是第二阶段,重点构建能更好支持下一代AI进化与规模化落地的基础设施,推动智能体深度参与基础设施的核心工作流[10] - 目标是实现从“将智能体视为工具”到“将智能体视为协作者”的范式转变,构建支撑智能体高效、稳定、低成本协作与进化的基础设施新形态[10] 当前Agent发展的核心问题与瓶颈 - 模型能力已经相当出色,但配套给Agent的基础设施服务与工具尚不成熟,瓶颈不在模型本身,而在支撑体系的响应能力[5][6] - 用户对“无代码编程”的期待是“用自然语言一步到位生成完整程序”,但现实仍需频繁迭代和更专业知识,高门槛和不确定性导致用户流失[5] - Lovable平台的用户数从6月的峰值3512万跌至9月的不足2000万,下降了超过40%[5] 算力资源优化与调度创新 - 传统AI算力基础设施以固定虚拟化或容器化单元划分资源,在Agent场景下极不经济,造成资源浪费[15] - 良好Agent Infra通过微虚拟化沙箱、沙箱调度和高并发沙箱管理机制,实现毫秒级环境切换和接近100%的资源利用[16] - 容器冷启动过程通常耗时数秒到数十秒,在高频创建和销毁任务的Agent场景中会造成大量时间损耗与资源空转[15] 异构算力统一调度与生态整合 - 核心技术创新是实现资源的统一标准化,包括功能层面打通不同类型算力的使用和效率层面实现任务的合理分配[16] - 国内算力资源种类多样、分布分散,基础设施必须始终面向最前沿,让Agent像使用水电一样使用算力[7][17] - 技术适配是早期最大阻力,一旦把不同模型与不同硬件之间的M × N映射打通,后续维护成本不高[17] 技术先进性与工程落地的协同 - 构建AI原生的基础设施,技术先进性与应用落地性相辅相成、互相迭代[19] - 研发支持弹性伸缩和动态资源调度的沙箱系统,每个Agent的沙箱可以按需启动或销毁,实现毫秒级响应[20] - 资源分配可根据任务类型和负载自动调整,通过智能调度引擎实现高峰弹性扩容、低峰快速收回,显著提升集群资源利用率[20] 未来基础设施形态与发展愿景 - 未来希望看到智能体之间进一步形成组织,共同完成更复杂的任务,各个智能体的KV Cache和上下文可以根据需求实现共享或隔离[14] - 目标是释放无穹算力,让AGI触手可及,通过系统层面的创新,让AGI能够更高效、更可持续地实现[22] - 基础设施引入Agent能力后具备自主性,从而实现更高效的资源整合和更具价值的功能创新[13]
近5亿!清华AI黑马斩获新融资,超25000P算力猛攻智能体基建
是说芯语· 2025-11-27 17:47
公司融资与背景 - 无问芯穹完成近5亿元A+轮融资,累计融资额近15亿元,成为国内AI Infra领域融资额最高的企业之一 [2][3] - A+轮融资由珠海科技集团、孚腾资本领投,惠远资本等跟投,老股东持续追投,阵容汇聚国家产业资本与头部市场化基金 [2][3] - 公司成立于2023年5月,创始团队来自清华大学、上海交通大学、阿里云与旷视科技等顶尖高校与AI企业,现有团队超过200人,硕博学历超63%,技术研发人员占比超过68% [3][4] 技术产品架构与战略 - 公司以构建可进化的Agentic Infra为战略核心,秉持"生产智能体、协同智能体、服务智能体"理念,形成"智能体基础设施 ×(AI云+终端智能)"技术产品架构 [6][7] - A+轮融资资金将投入三大方向:扩大软硬协同技术优势、推动AI云与终端方案规模化拓展、加大智能体基础设施研发投入 [7] - 目标是让云、端基础设施成为智能体落地的试炼场,助力智能体规模化应用成为基础资源 [11] 云端产品能力 - 无穹AI云实现六种不同品牌芯片间的交叉混合训练,算力利用率最高达97.6%,支持700亿参数规模大模型训练 [10] - 全球首创跨机房联合训练技术,容忍最低1GB/s带宽,支持最远约2000公里跨机房训练 [10] - 已完成超25,000P算力纳管,覆盖26座城市的53个核心数据中心,为百余家AI企业提供全流程降本增效服务 [10] 终端产品创新 - 推出全球第一款端侧全模态理解端模型无穹天权,以3B计算成本、7B内存需求实现21B级智能水平 [11] - 终端推理加速引擎无穹开阳在主流硬件上实现3倍时延降低、40%能耗节省和40%内存占用 [11] - 自研终端推理LPU IP无穹天璇在能效翻倍基础上大幅降低大模型推理成本 [11] 客户与生态合作 - 客户包括百川智能、Kimi、联想集团、理想汽车等头部AI企业,以及上海人工智能实验室、智源研究院等科研机构 [5] - 近期发布云端基础设施智能体蜂群Infra Agents与终端推理加速平台Kernel Mind,配套强化学习框架RLinf和通信框架Cache to Cache等智能体技术 [11]
5亿元A+轮融资,无问芯穹加速构建Agentic Infra | 巴伦精选
钛媒体APP· 2025-11-27 11:28
融资信息 - 公司完成近5亿元A+轮融资 [2] - 融资由珠海科技集团、孚腾资本领投,惠远资本、尚颀资本和弘晖基金跟投 [2] - 老股东洪泰基金、达晨财智、尚势资本&海棠资金、联想创投、君联资本、申万宏源、徐汇科创投、元智未来持续追投 [2] 资金用途 - 资金将用于扩大软硬协同、多元异构的技术领先优势 [2] - 推动AI云产品与AI终端方案在产业中的规模化拓展 [2] - 加大智能体基础设施研发投入,构建智能体服务平台及配套云、端基础设施 [2] 公司战略与愿景 - 公司已完成向智能体原生基础设施的转型 [2] - 战略核心是构建可学习、可进化的Agentic Infra [3] - 目标是实现智能体在数字世界与物理世界中的规模化普惠应用 [2] 产品与技术架构 - 公司搭建了“智能体基础设施 ×(AI 云 + 终端智能)”架构 [4] - 云端“无穹AI云”提供智能体服务平台和人工智能服务平台 [5] - 终端“无垠终端智能”提供端模型、端软件、端IP一体化解决方案 [5] 云端业务进展 - 无穹AI云已纳管超25,000P算力,覆盖26座城市的53个核心数据中心 [5] - 服务百余家AI企业,为其AI应用开发与部署全流程降本增效 [5] 终端产品性能 - 端模型无穹天权以3B计算成本、7B内存需求实现21B级智能水平 [5] - 终端推理加速引擎无穹开阳在主流硬件上实现3倍时延降低、40%能耗节省和40%内存占用 [5] - 自研终端推理LPU IP无穹天璇实现能效翻倍,大幅降低大模型推理成本 [5] 客户与合作伙伴 - 云端客户包括百川智能、Kimi、联想集团、理想汽车、智谱、中国移动等头部企业 [6] - 科研机构合作伙伴包括上海人工智能实验室、之江实验室、智源研究院等 [6] 新产品发布 - 发布云端基础设施智能体蜂群Agents Infra与终端通用推理加速优化平台Kernel Mind [7] - 配套技术包括强化学习框架RLinf和通信框架Cache to Cache [7] 行业定位与问题解决 - 智能体正成为人机协同与机器自主决策的核心载体 [3] - 传统基础设施依赖大量“胶水代码”,导致计算资源闲置、任务中断、运维成本高昂 [3] - 公司解决方案旨在突破人工智能产业应用的算力瓶颈 [6] 投资人观点 - 投资人认可公司在AI基础设施领域的技术前瞻性和系统化能力 [8] - 公司布局与我国构建自主国产人工智能产业生态的战略方向高度契合 [8]
腾讯研究院AI速递 20250924
腾讯研究院· 2025-09-24 00:01
英伟达与OpenAI战略合作 - 英伟达宣布与OpenAI建立战略合作关系,OpenAI将部署高达10吉瓦的英伟达系统,相当于400-500万块GPU算力 [1] - 英伟达计划在系统部署期间向OpenAI累计投资高达1000亿美元,首阶段系统将于2026年下半年基于英伟达Vera Rubin平台投入运营 [1] - 双方将共同优化模型及基础设施软件、硬件的技术路线图,以推动OpenAI实现通用人工智能使命,消息公布后英伟达股价上涨近4% [1] 无问芯穹基础设施智能体蜂群 - 无问芯穹发布基础设施智能体蜂群,通过多智能体协同架构覆盖模型筛选、资源运营、排障和集群运维等多个模块,实现基础设施全生命周期智能管理 [2] - 该解决方案彻底改变传统IaaS→PaaS→MaaS→Agent应用间层层堆叠的生产模式,以智能体为自治核心构建高度协同系统,显著提升资源利用率和运维效率 [2] - 通过与捏TA和Soul等客户合作,成功将迭代速度提升5倍,实现了运维能力百倍拓展,推动"AI基础设施范式"向"Agentic Infra"的转变 [2] 阿里开源多模态模型Qwen3-Omni - 阿里通义开源原生全模态大模型Qwen3-Omni,能无缝处理文本、图像、音频和视频输入,支持实时流式响应并同时生成文本与语音输出 [3] - 该模型在36项音频及音视频基准测试中获得32项开源SOTA与22项总体SOTA,超越Gemini-2.5-Pro等闭源强模型,支持119种文本语言、19种语音理解语言和10种语音生成语言 [3] - 阿里同步开源Qwen3-TTS-Flash语音合成模型和Qwen-Image-Edit-2509图像编辑模型,前者支持17种音色、10种语言和多种方言,后者新增多图编辑和单图一致性增强功能 [3] Kimi Agent会员服务 - Kimi推出Agent会员服务,之前打赏的金额在首次订阅Agent会员后可全额返还为会员时间 [4] - 会员服务采用音乐节拍命名:免费版为Adagio(慢板),付费版有49元的Andante(行板)和99元的Moderato(中速),海外还有199美元的Vivace [4] - 付费和免费用户主要区别在于Agent使用次数,中高档订阅会送等额API兑换券,高等级会员支持深度研究并发和高峰时段优先访问 [4] 清华大学MiniCPM-V 4.5模型 - 清华大学自然语言处理实验室和面壁智能发布MiniCPM-V 4.5技术报告,该模型以8B参数规模超越GPT-4o-latest和Qwen2.5-VL-72B等大型模型 [5] - 模型采用三大创新技术:统一3D-Resampler架构实现高密度视频压缩、面向文档的统一OCR知识学习范式、可控混合快速/深度思考的多模态强化学习 [6] - MiniCPM-V 4.5在OpenCompass综合评测中取得77.0的平均分,推理效率极高,在VideoMME上时间开销仅为同级模型的1/10,已在HuggingFace和ModelScope两大平台累计下载超22万次 [6] ima新版本功能升级 - ima推出最新版本,正式上线鸿蒙电脑版,至此实现鸿蒙系统手机、平板和电脑三端全覆盖,用户可在多设备间实现协同工作 [7] - AI播客生成功能全面升级,采用分段生成技术支持"边生成边播放",大幅减少等待时间,提升用户体验 [7] - 新版本的界面设计与之前版本略有不同,优化了整体使用流程,保留了核心功能特性 [7] 智元机器人GO-1开源模型 - 智元机器人开源通用具身基座大模型GO-1,采用全球首个Vision-Language-Latent-Action (ViLLA)架构,该架构通过引入隐式动作标记成功弥合图像-文本输入与机器人执行动作间的语义鸿沟 [8] - 模型采用三层协同设计:基于InternVL-2B构建的多模态理解层、隐式规划器和基于扩散模型的动作专家,虽仅基于AgiBot G1数据预训练,但已在松灵机器人、方舟机器人等不同本体和多种仿真环境中完成验证 [8] - 智元机器人同时推出Genie Studio一站式开发平台,为开发者提供全栈解决方案,包括数据采集、管理、模型训练、微调、评测与部署,同时支持LeRobot通用数据格式以适配其他机器人平台 [8] Transformer到GPT-5的技术演进 - Transformer八人小组成员Lukasz Kaiser在OpenAI从事GPT-5和"o1"、"o3"推理模型研发,是唯一一位未创业继续坚守技术前线的"Transformer八子" [9] - Kaiser早在2017年提出了"One Model To Learn Them All"概念,预见到大模型跨领域学习的潜力,并预言AI的下一阶段关键在于教会模型"思考" [9] - 据Kaiser预测,未来AI计算力将从大规模预训练转向在少量高质量特定数据上进行海量推理计算,更接近人类智慧模式,预示着又一次范式转移 [9] 心理学增强AI智能体技术 - 一篇名为《心理学增强AI智能体》的论文提出"MBTI-in-Thoughts"技术,只需在提示词开头加上"请用INTJ的视角回答"等简单指令,就能显著提升模型表现 [10] - 研究发现不同MBTI人格的AI在处理同一任务时表现差异明显:F型(情感型)更擅长写故事、煽情,E型(外向型)在幽默感和可读性上更强,T型(思考型)在策略游戏中更理性冷静 [10] - 这种方法本质是对人格概念的"终极压缩",让AI瞬间解压人类思维模式、行为逻辑、语言风格的统计总和,可用于组建互补性格的"AI团队"以应对不同任务需求 [11]
范式转移!无问芯穹推出基础设施智能体蜂群,开启Agentic智能体基础设施新纪元
机器之心· 2025-09-23 11:16
智能体基础设施范式革新 - 智能体是AI演进关键方向 正成为人机协同与机器自主决策核心载体 有望演进为未来智能社会基本单元[1] - 传统基础设施依赖大量胶水代码机械拼合环节 存在智算资源闲置 训练任务中断 运维团队疲于奔命等问题[1] - 需要基础设施系统拥有自主决策 协同和进化能力 通过智能体实现比人类操作更优更快更精准决策 支持更高效稳定普惠的智能体创新[1] 基础设施智能体蜂群解决方案 - 公司推出基础设施智能体蜂群 深度融合多智能体协同架构与行业场景需求 提供新一代基础设施智能化解决方案[2] - 封装SOTA模型筛选 基础设施平台管家 资源运营 答疑排障 智算集群运维等多个智能体模块 构建高度自治动态协作体系[2] - 实现对基础设施全生命周期智能感知 决策与执行闭环 显著提升资源利用率 运维效率和系统可靠性[2] 多智能体协同运作机制 - SOTA模型筛选智能体持续跟踪最新模型能力和系统需求 自动匹配最优模型与运行环境 避免盲目堆算力低效方式[5] - 基础设施平台管家智能体负责环境初始化 容器编排 配额管理和安全策略下发 感知用户任务意图并自动化底层操作[5] - 资源运营智能体实时评估算力利用率 队列等待时间 能耗和计费模式 动态调度资源池实现资源供需最优平衡[5] - 答疑排障智能体通过自然语言接口成为第一接触点 快速给出排障建议或触发诊断流程[5] - 智算集群运维智能体结合日志监控和Trace信息进行根因分析 自动修复 预判潜在风险[5] 实际落地效果 - 在重点文生文 文生图智能体客户真实业务流程中取得有效落地[8] - 某二次元创作平台通过端到端自动化调度与资源编排 显著减少算力适配 模型集成 安全部署等方面投入 迭代速度提升5倍[8] - 某社交平台创新周期实现极大压缩 试错成本大幅下降 技术门槛或资源限制想法得以快速落地[10] 技术理念与行业影响 - 提出Agentic Infra范式 以智能体为自治核心 改变传统IaaS→PaaS→MaaS→Agent应用层层堆叠相互割裂的生产模式[4] - 实现M(多种模型)×N(多种芯片)无感化 以及从灵感到交付自动化智能化[14] - 让企业特别是中小规模团队能以更低门槛更高效率方式构建高质量智能体应用[14] - 将人类从重复劳动中解放 使角色重新回归创造力本身[14]