Workflow
量子位
icon
搜索文档
给Agent装上“海马体”!上海AILab开源MemVerse,定义多模态记忆新范式
量子位· 2025-12-16 19:52
文章核心观点 - 上海人工智能实验室开源了MemVerse,这是首个面向智能体的通用多模态记忆框架,旨在解决当前智能体面临的灾难性遗忘与模态割裂问题,通过模拟人类认知的三层仿生记忆架构,实现从被动数据检索到主动记忆运用的范式转移,使智能体具备可成长、可内化、秒级响应的终身记忆能力 [1][4][6] 技术架构与原理 - MemVerse采用三层仿生记忆架构,模拟人类信息从暂存、结构化到内化的完整认知过程 [6] - 系统核心包含中央协调器、短期记忆和长期记忆:中央协调器作为“前额叶”主动感知情境并调度记忆模块;短期记忆采用滑动窗口机制保持对话连贯性;长期记忆构建多模态知识图谱,结构化为核心记忆、情景记忆和语义记忆 [11] - 首创“双通路”架构与“记忆蒸馏”技术,通过参数化记忆与周期性蒸馏,将长期记忆中的高价值知识轻量微调并内化到专用小模型中,实现知识的参数化内化 [1][11] 性能表现与优势 - 在ScienceQA基准测试中,搭载MemVerse后,GPT-4o-mini的综合得分从76.82跃升至85.48,提升接近9个百分点 [8] - 在MSR-VTT视频检索任务中,MemVerse在视频细节回忆上的R@1召回率大幅超越了CLIP的29.7%,也显著超过了ExCae的67.7%和VAST的63.9% [8] - 通过高效的记忆压缩与知识蒸馏机制,MemVerse能减少高达90%的Token消耗,大幅降低长期记忆的运营成本与延迟 [8] - 凭借双通道记忆设计,MemVerse将关键记忆的提取速度提升至毫秒级 [9] - 参数化蒸馏使检索响应速度提升10倍以上,解决了结构化存储的性能瓶颈 [11] 行业意义与应用前景 - MemVerse实现了多模态记忆的范式跃迁,使智能体从“被动数据检索”转向“主动记忆运用”,是从被动工具进化为智能助手的关键要素 [1][2][4] - 该框架为构建具备终身学习能力的智能体提供了一套通用、可扩展的多模态记忆范式,让较小的模型也能通过搭载MemVerse具备深度的记忆与推理能力 [10] - 该技术能让轻量级商用模型获得堪比千亿参数大模型的深度认知能力,为开发高性价比的“小而强”智能体提供了关键技术路径 [8]
用企业级智能体落地,还有谁没踩这四种大坑?无问芯穹的系统性解法来了
量子位· 2025-12-16 19:52
文章核心观点 - 2025年AI行业重心已从模型性能转向工程与场景落地,智能体(Agent)的规模化、稳定、低成本及商业化闭环成为企业面临的核心挑战[4] - 无问芯穹推出的智能体服务平台旨在作为智能体时代的基础设施,通过提供全栈能力、工程化经验与商业落地方法论,系统性解决企业智能体落地过程中的四大共性难题[5][7] - 智能体基础设施(Agent Infra)将成为决定企业未来竞争力的关键因素,其角色类似于为智能体车辆提供道路、能源和交通系统,无问芯穹正定位于此层,为企业提供稳固的运行底座[61][62][63] 企业智能体落地面临的四大挑战 - **效果问题**:智能体实际水平有限,效果受模型选择、提示词、检索链路等多环节影响,且易随业务更新而衰减,为维持效果常需专人维护,抵消了效率收益[2][11][12][13] - **规模化稳定性问题**:智能体在小规模试用时良好,但进入真实业务流后,全链路因素叠加易导致任务堆积、延迟抖动、工具调用出错甚至链条断裂等稳定性问题[14][15] - **成本挑战**:智能体调用成本高昂,例如一次DeepResearch可能消耗上百万token,成本高达20-50元人民币,加上开发优化时间、增长的上文长度及复杂工具组合,成本难以控制[17][18] - **商业化闭环缺失**:实现从产品流量、触达、支付结算到持续运营的商业正循环需要完整的工具链、渠道和支付能力,但多数智能体原生组织缺乏相应人力与系统兼容性,导致转化路径不稳定[19][20] 无问芯穹智能体服务平台的核心能力 - **解决效果问题**:平台提供超过5类智能体能力模板(如代码、研究、多模态),将大型行业客户经验标准化、模块化,赋能中小企业;具备Day 0级模型追踪能力,动态适配最佳模型组合;支持定制化提示词与工具调用优化[28][29][30] - **保障稳定性与可靠规模化**:依托全国算力储备提供稳定托管;通过弹性扩缩容和自动化排障,将百毫秒级沙箱调度压缩至十毫秒级,多个关键指标领先行业约50%;提供全链路可观测大盘,实现100%数据追踪[32][33][35] - **优化成本控制**:平台深度整合模型集成、推理优化和软硬协同,支持超过20种主流模型,并对顶尖开源模型进行深度推理优化;通过大规模PD分离方案,使千亿、万亿级模型(如DeepSeek、Kimi-K2-Instruct)推理效率相比传统模式提升3至5倍;全栈式软硬件协同优化帮助企业找到效果与成本的最佳平衡点[36][37][38][39] - **赋能商业化落地**:平台支持接入丰富的社区或自研工具集,可减少70%的集成和重复劳动;支持接入微信、小红书等外部渠道及支付结算能力,打通商业化路径,此能力在当前竞品中仍属稀缺[41][42] 平台价值与案例 - **全链路服务**:平台通过效果、稳定、成本、闭环的四重保障,提供从定制调优、部署托管、社交分享到支付接入的全链路商业化闭环陪伴服务[45] - **典型案例-SysCoding Agent**:该智能体可通过自然语言生成企业系统主流程与逻辑,首次生成的主流程完整性超过95%,规范遵从度超过90%,堵塞性bug发生率低于3%;企业内部测试表明,1人投入1周即可上线一个生产级系统,单系统建设成本最低仅需5元人民币[47][49][50] - **行业应用**:平台正被旅游、求职、教育等行业采用,帮助企业实现行业知识向智能化业务的转化和积累[50] 行业趋势与未来展望 - **发展阶段演变**:智能体进企业已从拼概念、拼效果,进入拼组织和基础设施的阶段[53] - **组织结构性变化**:智能体将成为最小的生产单元,承担重复性与结构性任务,人类角色更偏向决策与创造性工作;企业关键是如何让数十至上百个智能体稳定运行并相互协作以提升整体生产力[55][56] - **基础设施成为分水岭**:智能体基础设施(Agent Infra)将成为智能体时代企业间拉开差距的主要因素,其重要性如同为车辆提供道路、能源和交通系统[61][62] - **工程化驱动时代**:AI行业正从纯技术驱动转向工程化驱动,企业需要能稳住长周期的底层结构(如无问芯穹平台)才能借智能体驶入深水区[66][67]
量子位编辑作者招聘
量子位· 2025-12-16 19:52
公司概况与市场地位 - 公司是一家以追踪AI新进展为核心的内容平台,拥有8年行业积累[1] - 公司在微信公众号拥有超240万订阅用户,全网用户超700万,日均阅读量200万以上[12] - 公司在第三方数据平台(如新榜、清博)是AI及前沿科技行业TOP1新媒体[12] 招聘岗位与方向 - 公司开放三大方向的全职岗位招聘,工作地点位于北京中关村[2] - AI产业方向:关注基建层创新,包括芯片、AI Infra、云计算[6] - AI财经方向:关注AI领域创投和财报,跟踪产业链资本动向[6] - AI产品方向:关注AI在应用和硬件终端方向的进展[6] - 社招岗位覆盖编辑、主笔、主编各个层级,按能力匹配[6] - 校招面向应届毕业生,接受实习且可转正[6] 岗位职责详情 - AI产业方向职责:跟进芯片、AI Infra、云计算等领域新进展及核心玩家动态[6];解读前沿论文、开源社区及技术大会报告[6];参与核心采访,对话产业专家并撰写案例[7] - AI财经方向职责:聚焦创投、AI创业公司、上市公司、商业模式及产业链资本动向[11];产出创投融资、招股书财报解析、公司战略分析等稿件[11];访谈对话投资人、创业者及产业分析人士[11] - AI产品方向职责:关注AI在软件应用产品及硬件终端的落地[11];撰写AI应用产品深度评测,跟踪多终端新品发布[11];对话访谈AI应用创业者、产品专家及终端技术专家[11] 任职要求 - AI产业方向要求:对芯片、GPU、NPU、服务器、模型训练架构、云计算等有基本理解[11];熟悉AI行业供应链与生态[11];具备将复杂技术内容结构化表达的能力[11];有技术背景、理工或CS/EE方向优先[11] - AI财经方向要求:对数据敏感,对财报、股权结构、战略规划感兴趣[11];逻辑结构强,对商业叙事敏感[11];热爱对话采访,具备社交型人格[11] - AI产品方向要求:对智能硬件、AI终端趋势敏锐,是重度AI产品体验人士[11];熟悉各大终端厂商业态及体验方法论[11];具备强逻辑、体验表达和结构化能力[11] - 主编岗位需具备选题和带队能力及经验[6] - 主笔岗位需具备原创深度稿件能力[6] - 编辑岗位需热爱表达,喜欢挖掘信息,能够用通俗语言解读AI进展[6] 员工福利与发展 - 员工可第一时间接触AI领域最新技术和产品,构建完整的AI认知体系[6] - 员工可将各种AI新工具应用于工作,提升效率和创造力[6] - 员工可通过撰写独家原创内容建立个人知名度,成为AI领域意见领袖[6] - 员工可与AI领域大咖零距离接触,参与重要科技活动,拓展行业人脉[6] - 应届新人可获得主编级编辑的一对一指导[6] - 团队氛围扁平、简单、开放,奉行多劳多得、能者上位的原则[6] - 提供行业TOP薪资待遇,以及五险一金、餐补、项目绩效、商务绩效、加班补助等福利[6]
QQ音乐你变了,竟能免费在AI PC上原创一首《大东北》
量子位· 2025-12-16 19:52
AI PC的兴起与核心价值 - AI PC正在从底层计算范式上改变个人电脑的功能和使用方式,使其从一个被动的计算终端进化为主动的、智能的生产力和创造力中心 [9][36] - AI PC打破了专业与业余的界限,将许多曾经需要专业工作站才能完成的任务,带入到轻薄的笔记本电脑中 [10][11] 具体应用场景与用户体验提升 - 在AI PC上,用户可以利用本地大模型进行免费AI作曲,例如在QQ音乐上,用户只需输入灵感并选择曲风,即可在几分钟内生成一首包含引子、主歌、副歌的完整原创歌曲 [1][2][3][4] - AI PC极大地降低了各类创意工作的门槛,例如视频剪辑、修图、制作PPT、撰写报告等,使非专业人士也能轻松完成高质量创作 [7][8][23] - 本地AI计算提供了更高的安全性和自由度,用户数据无需上传云端,保护了隐私,并允许用户随时随地、断网使用AI功能 [24][25] 英特尔酷睿Ultra处理器的技术革新 - 英特尔酷睿Ultra处理器进行了史无前例的架构革新,首次在消费级PC处理器中集成了独立的NPU硬件单元,形成了CPU+GPU+NPU的异构计算架构 [29][30][31] - 在新的计算架构中,CPU负责通用计算和任务调度,GPU(集成锐炫显卡)专注于图形渲染和高吞吐量并行计算,而NPU则专为高效、低功耗地处理持续性AI工作负载(如实时字幕、背景虚化)而设计,从而提升能效和电池续航 [33][38] - 英特尔发起了“AI PC加速计划”,已吸引超过350家独立软件开发商参与,共同打造了近500多款AI优化应用,支持超过900个AI模型 [34] 行业趋势与未来展望 - 2023年被视为AI PC的元年,英特尔酷睿Ultra系列将AI能力从云端拉回本地设备,解决了数据隐私、网络依赖和实时性等关键痛点 [40] - 未来的竞争将是整个AI生态的较量,包括硬件算力协同效率、软件应用丰富程度以及开发者社区活跃度 [41] - 按计划即将上市的下一代处理器Panther Lake将在算力上进一步提升,带来更多元、更智能的AI PC体验 [41] - 技术升级的最终目的是满足更细分、更多元的用户需求,酷睿Ultra是朝着该目标迈出的关键一步 [44]
50万个AI生成的应用,正在赚钱
量子位· 2025-12-16 17:05
秒哒平台核心价值与市场影响 - 平台通过“零手写代码、零成本、零部署压力”的方式,赋能非专业开发者(“野生开发者”)快速创建商业应用,并已实现商业变现 [1] - 平台已生成 **50万个** 商业应用,覆盖 **200多个** 细分领域,累计服务超 **1000万** 用户,撬动经济与效率价值超 **50亿元** [1] - 平台明确聚焦于打造具备商业落地能力的实用型应用,而非“玩具”,旨在实现真正的商业转化 [10] 平台能力与技术架构 - 平台提供强大的前后端能力、丰富的插件生态,并预制了部署上线与渠道分发功能,开发者仅需提出创意即可“拼好应用” [12] - 平台并非依赖单一模型,而是一套由自研技术与多智能体(Agent)深度协同构成的应用生产系统 [51] - 生成流程模拟真实软件开发:先由“产品经理智能体”将模糊需求拆解为结构化方案,再自动进行UI设计、前后端开发与部署 [53][54] - 平台自动为应用集成完整的数据后端体系(包括数据库创建与服务托管),并支持一键发布为网页端、移动端和微信小程序 [57][59] - 平台内置 **50多个** 官方插件,覆盖文生图、支付等常见能力,并支持用户快速生成自定义插件 [61][63] - 平台支持源码导出、可视化数据库管理、多种身份认证方式,并与外部工作流工具打通,以满足二次开发和工程可控性需求 [66] - 平台运行一套“数据飞轮”机制,利用用户数据持续优化模型,并依托百度智能云的Agentic数据库、高性能沙箱等提供稳定支撑 [67][68] 典型应用案例与商业成果 - **荣堂古村数字博物馆**:由景区团队利用AI快速生成,游客扫码获取游览指引,带动当地手作年销量突破 **1000件**,并逐步形成文旅生态 [3][5][7] - **油气井设计与方案优化平台**:由石油工程师一人借助AI在一个月内完成,其三维井轨迹可视化效果“优于行业多款专业软件”,已投入多个油田及石油大学使用,节省成本超 **140万元** [14][16][17][18][19] - **快探AI小说生成工具**:由音乐琴行老板开发,支持从大纲到有声小说的全流程生成,并通过卡密售卖、会员等方式变现,支持生成微信小程序 [20][21][24] - **蜗牛牙牙儿童护牙系统**:由口腔预防教育团队开发,提供刷牙评估与风险筛查,已推出付费训练营并实现近万元营收,且已打通微信支付 [25][26][28][29] - 平台已有超 **2万个** 应用接入支付能力,累计完成超 **8万笔** 真实交易 [71] 开发者体验与平台易用性 - 开发流程简单:用户用一句大白话描述应用想法,平台可提供“指令优化”帮助细化需求,支持上传照片、文件作为参考 [36][37][39] - 生成过程无需编写代码:从视觉设计、前后端开发到部署全程由AI自动完成,编程小白可轻松上手 [43] - 平台支持通过对话、可视化界面甚至截图进行应用修改,实现“截哪里,改哪里” [65] 商业化支持与生态建设 - 平台为应用商业化提供闭环支持:集成网页端与微信小程序支付能力,无需额外开发;应用可与搜索引擎打通,获得流量曝光 [59] - IDC报告指出,平台在“平台能力”与“应用质量”两个维度表现突出,在服务集成、应用复杂度支持等方面处于行业领先 [71] - 平台发布“创造者筑梦计划”,目标扶持 **100万名** 创造者实现创收,并计划在2026年遴选 **15个** 优质项目,提供百万元级别以上的投资支持 [73] - 筑梦计划将从分发(设立千万基金、提供百度搜索流量)、交易(模板插件分成)、商单(对接百度智能云客户)、技术(官方支持)等多层面提供扶持 [76] 行业趋势与意义 - 以秒哒为代表的对话式应用搭建平台,正在降低软件开发门槛,使软件开发被更多非专业人群所触及 [69] - 平台解决了传统软件开发需要专业团队、高成本、长周期的问题,使得大量分散、细碎的真实需求得以被验证和实现 [69] - 平台提供从应用上线、分发推广到持续运营的一站式商业化闭环能力 [70]
推特吵架吵出篇论文!谢赛宁团队新作iREPA只要3行代码
量子位· 2025-12-16 13:58
文章核心观点 - 一篇由社交媒体讨论引发的学术研究论文,挑战了计算机视觉领域的传统观念,即预训练视觉编码器的全局语义分类性能(如ImageNet-1K准确率)是驱动生成模型质量的关键因素[7][23] - 研究结论表明,视觉表征的空间结构信息(即图像局部区域或补丁tokens之间的相互关系)才是决定生成性能的主要驱动力,更好的全局语义信息并不等于更好的生成效果[23] - 基于此发现,研究团队对现有的表征对齐框架进行了简单改进,提出了仅需3行代码即可实现、能持续提升性能的iREPA方法[3][32] 研究背景与起源 - 该研究的灵感源于4个多月前,研究员谢赛宁与网友在社交媒体上关于自监督学习模型应用重点的一场辩论[2] - 辩论核心是:为稠密任务(如REPA、VLM)设计的模型,其性能应更依赖于捕捉图像局部细节信息的patch tokens,而非仅用于全局分类的[CLS]token[8] - 谢赛宁最初持反对意见,但被网友提供的论据(如SigLIPv2和PE-core在REPA任务上优于DINOv2的例子)说服,并最终促成了跨团队合作研究[13][17] 核心研究发现 - 通过大规模定量分析验证,覆盖了**27种不同的视觉编码器**(包括DINOv2、v3、Perceptual Encoders等)及**3种模型规模**(B、L、XL)[26] - 研究发现,**线性检测准确率仅约20%的视觉编码器,在生成任务上可以超过准确率>80%的编码器**,颠覆了“更大更强编码器带来更好生成效果”的传统观念[23] - 生成效果更好的表征,其**空间自相似性**指标更强,即图像内部不同区域token之间的关注关系更明确[25] - 研究甚至发现,像**SIFT、HOG这样的经典空间特征提取方法**,也能带来与现代大规模视觉编码器(如PE-G)相竞争的提升,进一步凸显了空间结构信息的基础重要性[28] 方法论与模型改进 - 研究基于对表征对齐(REPA)框架的分析,提出了改进版本**iREPA**[30] - iREPA的核心改进包括两点:1) 将REPA中标准的MLP投影层替换为一个简单的卷积层;2) 为外部表征引入一个空间规范化层[31] - 这些修改旨在**保留并强化输入表征中的空间结构信息**,从而显著提升性能[32] - iREPA的实现极为简洁,**仅需3行代码**即可添加到任何表示对齐方法中,并且在REPA、REPA-E、Meanflow及JiT等多种训练方案中都能实现持续更快的收敛[3][32]
AI终点不是算法,而是业务成果 | 云徙科技@MEET2026
量子位· 2025-12-16 13:58
文章核心观点 - 当前AI在企业核心业务中的真实渗透率极低,可能不到1% [1] - 行业需要从“AI+”的“工具叠加”思维,转向“运营×AI”的“运营重构”思维,实现AI从工具到业务主体的跃迁 [4][6][10] - 实现AI落地需跨越认知、操作、燃料、协同四重鸿沟,并进行战略、组织、技术“三位一体”的系统性重构 [15][17][18] - 云徙科技通过其xGOS.AI企业运营超级智能体及实践案例,展示了如何构建具备全链能力的Agentic AI,驱动业务成果 [20][30][32] 行业现状与核心问题 - **AI渗透率低**:尽管大模型参数规模爆炸式增长,但AI在企业核心业务中的真实渗透率可能都不到1% [1][8] - **应用思维局限**:大多数企业对AI的认知仍停留在“工具思维”层面,如同“在燃油车上加装导航系统”,仅局部提升效率,未改变核心业务流程和决策机制 [9] - **面临多重鸿沟**:企业面临认知、操作、燃料、协同四重鸿沟,导致AI投资止步于“玩具”或“部门级工具”,无法转化为企业级运营战斗力 [15][23] 未来趋势:从“AI+”到“运营×AI” - **运营主体变革**:未来运营主体将从“人+系统”转变为“人+智能体+机器人”的新型协同体 [6][12] - **AI角色跃迁**:AI将从“回答问题”的工具,跃迁为对业务结果负责的“业务主体”或“数字员工” [6][13][14] - **运营节奏变革**:运营从“月度/周度会议”驱动的周期化响应,转变为由“实时数据”驱动的实时化干预 [13] - **竞争壁垒变革**:竞争从比拼“流程效率”,升维至较量“决策速度与精度” [13] 跨越鸿沟的破局之路 - **战略重构**:AI必须从“技术采购”上升为最高级别的“核心战略”,预算性质应从“IT成本”转为“业务增长投资”,目标是再造以智能体为核心的下一代运营体系 [18] - **组织重构**:必须打破“职能筒仓”,组建由业务负责人、AI训练师和智能体共同组成的“业务智能单元”,组织核心职能转向“训练、编排和领导智能体” [18] - **技术重构**:从“系统堆砌”转向“能力乐高”,将企业核心业务能力封装成标准化、可被智能体调用的“业务能力积木”,并构建统一的“智能体协同体系” [18] - **系统性工程**:这不是单纯的算法或模型问题,而是“业务+技术”的系统性融合工程问题 [19] 构建Agentic AI的三步路径 - **第一步:重塑业务流**:面向“人+智能体+机器人”的多类协同模式,建立可拆解、可封装、可重用、可编排、可协同的动态智能业务执行基座 [6] - **第二步:解决数据供应链**:基于拆解后的业务流,从业务源头解决数据问题,不仅进行数据治理,更重要的是给数据赋以语义,为推理模型提供燃料 [6] - **第三步:构建协同飞轮**:基于业务场景构建AI应用,形成“业务智能+数据智能+AI”协同共生飞轮,构建具备“需求感知-策略计划-业务执行-实时反馈”全链能力的Agentic AI [6] 云徙科技的实践与解决方案 - **解决方案定位**:云徙科技作为企业全链路AI解决方案赋能伙伴,深度融合10年行业沉淀与前沿AI能力,打造xGOS.AI企业运营超级智能体 [20][30] - **覆盖范围**:解决方案覆盖“营销-订单-供应链-业财”全链路,旨在为企业交付可自主驱动业务的“数智运营团队” [20][32] - **系统架构**:xGOS.AI构建了“策略智能辅助-业务智能执行-数据智能反馈”的“三位一体”智能增长飞轮,以xAaaS智能体运营平台为“大脑”、xBiz业务智能平台为“手脚”、xData数据智能平台为“神经网络” [32] 落地应用案例 - **促销管理场景**:通过多个智能体协同,将大型促销的决策周期从“数周”缩短至“分钟级”,实现从策略生成到全渠道自动部署的闭环,促销ROI获得可量化提升 [21][22] - **会员运营场景**:通过智能体实时分析用户行为并自动组合营销策略包,在关键时刻提供确定性服务,实现从“广撒网”到“精准狙击”的转变,显著提升转化率 [24][25] - **供应链补货场景**:供应链智能体接入多源实时数据,为每个门店及SKU计算动态安全库存,实现从需求感知到订单执行的秒级闭环,成功降低缺货率并大幅提升库存周转 [28]
顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式 | 卓世科技@MEET2026
量子位· 2025-12-16 08:56
核心观点 - 大模型商业化已进入新阶段,焦点从模型能力竞赛转向行业落地、场景赋能与可持续变现[7] - 产业级AI的核心在于构建由模型、终端与数据交互构成的自循环闭环,而非单点技术突破[3][7] - 真正能跑通商业化的大模型体系需同时具备技术自研、产品标准化与商业模式创新“三件套”[13] 行业趋势与公司定位 - 2023年被定位为大模型元年,2024年为智能体元年,2025年行业更关心如何做行业落地、场景赋能和商业化变现[9][10] - 公司拥有七八年发展历程,由百度、阿里、华为等大厂核心技术团队成员创建,专注于大模型算法、行业模型与智能应用[12] - 公司以打造“模型→终端→数据→模型”的商业闭环为核心引擎,并入选中国大模型产业图谱,是拥有大模型和深度合成算法双备案的国家级专精特新“重点小巨人”企业[12] - 公司在教育部、人社部和工信部是重点合作单位,并参编了面向养老领域的行业标准[12] 技术路径与产品架构 - 公司认为大模型落地是工程化能力的竞争,从预训练到部署优化的每一环都决定能否在真实场景释放效能[13] - 公司自研的“璇玑玉衡”备案大模型代表了从预训练、微调、智能体开发到数据工程和产品落地的全栈技术能力[15] - 该技术架构串联智能终端、大模型中台(企业AI大脑),并向上构建面向不同领域的超级智能体[15] - 强调“模型→终端→数据→模型”的闭环,终端是感知物理世界的入口和数据来源,数据回流持续反哺模型增强行业赋能能力[17][19] - 公司携手某国际顶级人工智能研究院,共同开展数字员工与企业业务流深度融合的课题研究[14] 商业化落地模式与案例 - 商业化落地需要组合拳,包括强大的自闭环技术能力、标准化的产品平台、独特的商业模式创新以及可靠的服务体系[20][21][22] - 公司服务案例已覆盖企业服务、工业制造、医疗健康、文教传媒、养老、水利、园区等多个领域,对应国家“AI+”政策方向[4][24] - **企业服务案例1(北京某国企)**:落地工作流程自动化、行业研究报告生成、智能化办公助手,将大模型能力融入工作流程[25][26] - **企业服务案例2(某快消品巨头)**:利用大模型分析大量市场数据(成千上百表格、上万字段),将原本需专业团队一个月完成的工作缩短至两三人一周内完成,大幅提升人效[27][28] - **工业制造案例(多晶硅生产)**:大模型作为大脑,融合视觉模型、时序模型,自动调优生产工艺参数,实现每公斤多晶硅节约2度电,全年带来千万级成本节约[29] - **医疗健康案例**: - 基层卫生:与国家卫健委基层司合作,为社区医院和家庭医生服务提供支持,大模型已融合2000多种常见病和常用药知识[31] - 三甲医院:利用医院沉淀的专科专病数据构建辅助诊疗大模型,覆盖门诊和住院环节,旨在将全院医疗水平拉齐至最高医生水平[31] - **养老领域**:开发了健康管理师、养老护理师、职业培训师、能力评估师等持证上岗的数字员工,服务养老机构[32] - **水利水务与园区**:基于领域沉淀数据和前端传感数据,利用大模型进行定量定性分析以提升管理水平;与园区协同,为园区内企业提供大模型与智能体服务[35] 产品与部署方案 - 公司提供大模型一体机解决方案,具备开箱即用、模型与应用一站式封装的特点,满足客户多样化需求[36] - 一体机支持本地部署保障数据安全,提供百级别并发支持,平均首token响应时间为1秒,系统吞吐达3872 tokens/秒[36] - 全栈交付方案可使部署成本降低10倍,支持多版本规格、多精度,并兼容国产AI生态以满足信创要求[36] - 产品支持多模态应用开发与交互,向量检索准确率达95%,并能解析多类型文档[36] - 公司针对英伟达及国内所有算力芯片都做了算法和框架层面的调优,以发挥硬件极致性能[36] - 部署方式灵活,支持私有化、公有云、混合部署及与一体机协同[35]
无预训练模型拿下ARC-AGI榜三!Mamba作者用压缩原理挑战Scaling Law
量子位· 2025-12-15 18:33
文章核心观点 - 研究提出了一种名为“最小描述长度”的新智能配方,挑战了智能必须源于大规模预训练和数据的假设[1][48] - 该方法通过一个仅76K参数、未经预训练的模型,在推理阶段最小化目标谜题的描述长度,成功在ARC-AGI-1基准上解决了20%的问题[3][7] - 这项研究被视为一条通往通用人工智能的可能的、互补的替代路径[48] 研究方法与原理 - 核心思想源自最小描述长度理论,旨在为特定谜题寻找能用最少比特信息表述的最短计算机程序,该程序即揭示了谜题的本质规律和解法[7][8][10] - 该方法不依赖训练集或预训练,仅使用谜题本身(两个示例输入/输出对和测试输入)进行推理[12] - 通过设计一个固定的“程序模板”,并将寻找最短程序的问题转化为寻找最短的种子和神经网络权重的问题[25][29] - 借鉴变分自编码器原理,将程序长度最小化转化为可微分的优化问题,使用KL散度和交叉熵损失来近似种子的预期长度,从而可用梯度下降求解[30][33][34] 模型架构与设计 - 模型参数极少,仅有76K参数[3][43] - 架构内置了强大的归纳偏置,包括对旋转、翻转、颜色置换等常见变换的等变性处理[38][39] - 使用“多张量”数据结构来存储不同粒度的信息,以支持更有效的抽象推理[40][41] - 核心骨干是类Transformer结构,但核心操作是一系列针对谜题规则高度定制的、无参数的自定义操作,而非传统注意力机制[42][44][46] 性能表现与对比 - 在ARC-AGI-1基准的公开评估集上,准确率达到20%,在训练集上达到34.75%[3][7][48] - 是目前唯一一个只在单个样本上运行的深度学习方法[4] - 相比其他方法:未使用训练集的暴力规则搜索准确率为40%,使用测试谜题训练的HRM变体为31%,使用训练和测试谜题训练的HRM为40.3%,基于互联网数据预训练的OpenAI o3模型则达到87.5%[4][19][20][21] - 该研究获得了ARC Prize 2025的第三名,且仅使用一张GPU完成[5] 实验与意义 - 为评估每个谜题提供2000个推理时训练步骤,每个谜题约花费20分钟[47] - 研究作为一个概念证明,展示了现代深度学习框架与最小描述长度理论结合的可能性[48] - 所针对的ARC-AGI-1基准由François Chollet提出,旨在评估AI处理新颖问题、习得技能的能力,是衡量通用人工智能能力的核心标尺之一[51][52]
PPIO姚欣:AI正在进入自主行动与创造时代,智能体需要全新的操作系统|MEET2026
量子位· 2025-12-15 18:33
AI行业趋势:迈向Agentic AI时代 - AI行业正从生成式AI迈向自主执行和创造的Agentic AI时代,这被视为真正的落地元年,正在改变应用形态并重塑AI技术栈的底层逻辑[1] - 未来的AI应用将从回答问题的工具转向能够直接完成任务的助手,行业迫切需要一种新的基础设施——Agent时代的操作系统[2] - 智能体将成为未来AI应用的主力,而Agent Infra将成为下一个AI时代的操作系统,其核心目标是通过新的Runtime体系,实现模型能力、工具能力与执行能力的高度融合[3] 智能体的定义与演进 - 行业正从Generative AI向Agent AI进步,标志性产品如豆包手机能够自动下单、比价比价和执行任务,展示了AI应用像智能体一样自动化完成任务和进行创作[8] - 当前行业内许多人将智能体定位为工作流,但早期的编排工具(如扣子)或具备Deep Research功能的AI工具只是智能体的早期形态,并非完全体[9][10][11] - 真正的完全态智能体需要具备自主分析、自主决策以及自动化完成任务的能力,其核心在于执行与落地环节[11] - 真正的智能体需要从能力堆叠走向系统化结构,它需要全新的架构和形态,不能依赖旧式应用或工作流体系[12][13] 智能体的核心架构与组件 - 根据OpenAI研究员的论文,真正的智能体包含四个核心组件:记忆、规划、工具和行动[14][15] - 在数字生命体类比中,记忆类似于大脑的记忆功能,负责短期和长期记忆;规划更像思考单元,负责深度推理和分析;工具和行动则类似于感知和影响外部世界的五官与手脚[17] - 真正的智能体是一个具备从思考到执行再到分析的综合系统,而不仅仅是执行机器[17] Agent Infra:AI时代的操作系统 - 智能体的基础设施更像操作系统,它是管理异构资源、抽象标准化功能调用的核心中间层,这一角色在PC、移动和云时代都未改变[18][21][22] - Agent Infra本质上是构建AI时代的操作系统,它管理的资源是模型能力、工具调用能力以及任务和执行能力,并完成资源管理、统一调度与抽象,以方便上层应用构建[23] - 在整个Agent Infra体系中,最核心的部分是Runtime,它解决智能体“能否跑起来”的问题,确保其能在各种环境下大规模、通用地适配并稳定运行[24] PPIO的实践与产品 - PPIO是一家AI云计算公司,构建了从底层算力到IaaS、PaaS、MaaS的完整AI云能力,为Agent Infra提供底座支撑[26] - 在算力网络层面,公司整合了大量数据中心闲置算力,在中国拥有4000多个算力节点和1300多个合作伙伴,并在2024年将算力网络部署扩展至全球六大洲三十多个地区和国家[28] - 在GPU推理云平台层面,公司于2023年打造了第一代推理云平台,2024年推出分布式推理引擎,托管近百个开源与社区模型,每天处理接近2000亿Token[28] - 公司发布了首个兼容E2B的Agent沙箱,这是一个专为Agent执行任务设计的云端运行环境,以Runtime为核心整合了模型调用、记忆和数据库能力[28][29] - PPIO Agent沙箱基于Firecracker MicroVM构建,具备强安全隔离、毫秒级极速启动(小于200毫秒)、高并发创建(可同时快速启动数千个实例)三大特性[31] - 该沙箱支持动态调用多种工具,旨在为Agent赋予安全可靠、高效敏捷的“手和脚”,并通过安全隔离环境帮助降低错误率,自上线以来月度活跃数持续增长[29][31][32]